五月天六月婷婷开心激情,天使的性电影,三级韩国一区久久二区综合,五月婷婷久,九九精品在线视频,66精品综合久久久久久久

您的位置:首頁 >打榜 >

GOTC 2023 出品人劉松:二十年 IT 見證者眼中,數據技術的未來

2023-05-21 22:41:51 互聯網

一個詞來介紹我,我是個經歷者,但更像一個觀察者。我其實是整個軟件行業過去 20 多年的一個見證者和觀察者。作為觀察者要有客觀總結能力,然后包括對未來的一些看法,但是未來的看法不一定對,比如說 GPT 的看法沒有人能打包票。

——PingCAP 副總裁 劉松

每個時代都需要觀察者,尤其是在技術變革加速的今天。在 GPT 帶來的震蕩之中,各領域技術都在尋找新的方向, 數據庫技術也不例外,動作快的數據庫和服務廠商也已經集成了 AI 工具做 SQL 自動生成與性能優化。然而,面對 “來勢洶洶” 的 AI 技術浪潮,數據庫技術的方向在哪?又該如何用好 AI?OSCHINA 采訪了 GOTC2023 出品人、PingCAP 副總裁劉松,請他談談最近大熱的 AI 技術,以及在新浪潮之下,數據技術的未來。


(資料圖)

劉松,PingCAP 副總裁

簡介:曾經擔任甲骨文大中國區技術戰略部總經理,阿里云副總裁等職務,曾負責阿里云的云計算生態構建,智庫合作,人才培養計劃等工作。劉松長期活躍于中國軟件產業,親身觀察互聯網與信息化產業融合趨勢,在軟件與互聯網行業發展趨勢,云計算和開源產業的商業模式構建,數據庫技術發展趨勢,企業數字化轉型等方面多年的實踐經驗。

5 月 28 日,劉松擔任 GOTC 2023 “數據與數據庫技術” 分論壇出品人,并發表《從 HTAP 到 Serverless,TiDB 的技術演進之路》主題演講,敬請期待!

參會報名,請訪問: https://www.bagevent.com/event/8387611

OSCHINA:您最近這段時間很關注 GPT 的動態,到目前為止,對它最深的感觸是什么?

劉松:

我覺得可以用一個詞 —— 涌現,Emergency。

我個人是一個復雜性系統科學的愛好者,大家可能聽說過圣達菲研究所,致力于復雜系統科學的研究。在八九十年代的美國,涌現有一個時代特定的含義 —— 當一個復雜性系統超過某個臨界點,就會誕生很多按照原本系統的線性思維下預測不可能發生的事情。

首先是大模型,過了千億級別以后,一下子就變得有智能了,這是一種涌現。

第二個涌現現在正在發生,當 GPT 這類大模型的技術與我們熟悉的軟件事業、各行業場景結合后會有更大一輪的涌現。現在發生了很多原來我沒想過的一些非線性的爆發,短時間內突然產生了原來沒有的東西,這些東西的形態又是一個爆發狀態,像所謂寒武紀大爆發的邏輯。

ChatGPT 從去年 12 月開放,中文世界到了今年 2 月之后,一下子話題爆了。一方面是技術過了臨界點,讓每個人都有所觸動,發現自己懂的東西原來 AI 更懂。另外一點就是,尤其 IT 圈以外的人,都覺得它能改變我的工作甚至是未來的命運,都是有可能的,所以我想這可能是最重要的感觸,是一個涌現的開始。

OSCHINA:您最近還說過一句話 —— 十年云舞臺,新的舞者是 Serverless+HTAP+AI。怎么理解這句話?

劉松:

我成為一個云的從業者剛好是十年前,2013 年是我在 Oracle 的最后一年,從那時候開始,Oracle 中國的人給我的稱謂是 Mr. Cloud。那時候 Oracle 剛開始轉型做云,包括數據庫、SAAS。后來第二年我就去了阿里云,算是阿里云商業化的第一批人,主要負責云生態,也做了一些垂直行業比如金融云的工作。所以對云的理解差不多正好是十年。

到了前兩年我認為云 1.0 差不多算是收官了,以資源型為主的云是基礎設施,可以讓所有行業應用可以快速、彈性上云。我在云舞臺上已經待了十年。現在回頭看,云最大的方向是承擔全社會數字化轉型的最終命題,其中隱含的兩個關鍵技術,一個是數據技術,一個是人工智能,而且這兩個東西都強調是以云為主。

在數字化里面,所有用戶都希望要有以 HTAP 技術為代表的一體化的數據服務。AI 技術方面,這一波 GPT 的涌現已經告訴所有人,要有巨大的算力支撐才能將 AI 訓練到這個級別。

那么這三種技術在未來會有更深地融合。

我們在 1 月 10 發布了一個小產品,在 TiDB Cloud 上面發布了基于 AIGC 的智能數據探索功能 - Chat2Query。大家可以很容易看到自然語言秒內生成 SQL,然后通過 HTAP 這種技術,快速用行存列存混合的方式返回一個要查詢的結果。當資源不夠的時候,會通過 Serverless 自動擴展。

Serverless+ HTAP + AI,這三種技術在今天也有一個共同的承諾或者說特點 —— 在秒級別去反饋人類的需求,秒級別把你說的話變成 SQL、秒級別做復雜查詢、當資源不夠時再秒級地做用戶無感的云資源調用。

過去十年,很多互聯網公司、大型企業數字化講上云,但本質上是做兩件事,第一件事是買云端資源,用戶采用租用的模式,付費方式并不是因為某個特定 Query 的查詢來付費。過去十年云計算市場形成了通過互聯網的方式提供資源租用的形態,但這個形態大家已經進入到同質化的階段。向上延伸就是把云 1.0 的底座夯實。

夯實算力基礎,不管是 CPU 還是 GPU 都是非常重要的。大模型訓練也是靠這個,OpenAI 訓練的背后很大程度上也是靠微軟的云。今天亞馬遜云,阿里云也都快速跟進,因為這對云廠商來說絕對是一個機會。

OSCHINA:未來的關鍵塑造因素在哪?數據庫技術可能的服務場景是什么樣的?

劉松:

如果說過去的十幾年亞馬遜在全球靠基礎設施的創新,包含軟硬件的創新領先。那么往下五到十年,云 2.0 的最大舞臺依賴三個關鍵塑造因素,一個是云自己的云原生,二是數據技術,第三個是 AI 變成一種類似基礎服務?當然還有另外一點是,新的大模型和數據庫技術能不能在 B 端融合創造出更多新場景,這也是大家非常關注的話題。

云端的 AI 和數據庫的融合可能是發生在 B 端。我們現在用 GPT 類產品主要還是普通人在一個公共廣場上解決一些科普性的問題,而且大部分是非結構化數據。但是我們試想一下,一個企業的 CEO,他非常關注的話題,GPT 類產品是不能直接解決的,比如說我希望讓我的企業的下個月人才提效指標 10% 應該從哪些部門入手?

對于這個問題,一方面需要企業內部的數據庫里有大量的專業應用的模型和算法,另一方面還要比對外界的同行、考慮經濟環境是怎么樣的。所以我們設想一下,假如我們列一個 CEO 的 100 個常見問題。那么未來五到十年,能不能通過自然語言的方式詢問?通過 AI 和數據庫結合,包括大模型,內外部數據的結合,給到 CEO 這些問題,這個是我們可以憧憬的一個地方。

OSCHINA:數據技術和 AI 技術發展的不同在哪?

劉松:

數據庫行業是四世同堂,到今天,你還是可以在云端,比如說 AWS 上買到 Oracle 的數據庫服務,無論是之后的開源 MySQL、Redis,還是我們的分布式數據庫 NewSQL 像 TiDB 這樣的數據庫云都有市場。數據庫相對來說格局更清晰,四世同堂,每一個都能盡量尋找自己的價值和體驗。價值就是你能不能以更好、更快的方式兌現數據價值,體驗是指在云端的數據庫體驗會不會更好。

在數據庫領域,數據庫領域的多種技術都有存在的意義,另外一方面反過來說,沒有一種新技術能夠完全替代原來所有的技術。

但 AI 技術正好相反,AI 技術的屬性是弒父。新的技術只要一出來,原有的技術,不管是爺爺還是父親全部都沒有意義了,這個就是從 GPT 對于 NLP 的顛覆就能夠看出來,這思路就完全變了。那下一代出來的東西很有可能也會把當前的 GPT 模式完全殺掉。這方面看大模型類的 AI 應用確實風險等大,但機會也會更大。

我覺得 AI 相關的大模型或者應用生存的關鍵在于專業門檻,未來無非就是向上和向下兩個方向發展。一個是底層技術的先進性,比如大模型本身的先進性,這個大家都看得到。然后 AI 技術向場景延伸時,有兩個地方必須閉環,形成門檻:一個是專業領域的數據,比如醫療、汽車等領域,如果大模型能訪問到其數據,在這個領域里就會更強;還有向上應用的創建性,面向用戶的,可以想象,未來無論是人力資源管理還是所有的客服體系、數字營銷、新一代的 BI,廣義上的新一代搜索等等,這些可能都會被 GPT 這樣的智能技術重新做一遍。

那么重復的門檻在哪里?一個是模型本身,一個就是專業數據的提煉和學習能力,還有一個就是應用構建的友好度,或者說是體驗。即 AI 在垂直行業的體驗加上價值,在這個基礎上,AI 可能要比數據技術面臨更大的或然性和挑戰。

OSCHINA:PingCAP 現在對未來是什么看法,采取了哪些行動?

劉松:

我們現在有一個新的信念,認為 AI 和數據融合會對于企業用戶產生巨大的、全方位的價值。

有三個層次,第一個層次是用戶最容易見到的,像 Chat2Query 里做的,就是自然語言代替了 SQL,成為主要的查詢語句。在用戶想要獲取一些洞察及服務的時候,比如一個快遞小哥、外送小哥、或者每個消費者去查詢你的商品、外賣到哪里了的行為,其實是一種數據消費。如果這樣的查詢都用自然語言來解決,整個數據庫的使用人數和頻次可能會大 100 倍、1000 倍,甚至更大。反過來,這對數據技術與 AI 技術的融合帶來了更高的要求。

第二個層次,以數據庫技術的處理和查詢優化為例,這幾年數據庫技術領域主要有兩個流派,一個是 AI For DB,一個是 DB For AI。簡單來說,一個是數據庫的 “自動駕駛”,維護可以用機器學習去優化,這樣就不用花太多人力成本,尤其是在云端。另外一個是查詢的優化,包括性能的調優,這是數據庫領域老大難的問題,現在可以通過 GPT 和相關的 AI 技術來解決。那么這些數據運維,以及數據架構師的工作量就大幅降低了,任何一個項目都會以比之前更快的速度迭代。

最后一層對于數據庫技術本身的要求,當 AI 變成每個人通用的、用來做查詢和獲取洞察的工具的時候,中間有一些工程調優,包括對算法的調用等等,那么數據技術到底應該以什么方式來組織?

我們認為,可能傳統數據庫的未來會變成一種在線數據服務的形態 ——online Data Service,這是廣義的,還不是簡單的數據庫變成了服務。這也是 PingCAP 在過去幾年一直在演進的。

我想我們最大的變化是從一個更多地服務互聯網場景的分布式數據庫,變成了一個以云端為主的數據服務廠商,這是一個廣泛意義上的數據服務,不管是交易還是查詢都有,我們現在也是一個開放式的架構。

所以我想總結一下,這一波 AI 變成了一個新一代的 GUI,會增加千倍萬倍的使用數據的用戶。首先對于數據庫的所有的從業人員,AI 是提升性能調優和各種項目工程進度的巨大助力。另外在現在這種數據服務這種形態,可能更能夠和 AI 做很好地結合。這也回到我剛剛講的小例子,關于 Chat2Query,用戶用秒級自然語言提問的問題,變成 Query,再到通過 HTAP 技術來實現查詢,這其實就是一個數據服務,然后很快給用戶反饋結果、帶來一個決策,那這個閉環是在秒級。這就是我們認為未來,AI 和數據技術在云端,三者形成了一個全新的、組合式的創新,變成了一種新的數據服務形態。

0635

“數據與數據庫技術” 分論壇將在 5 月 28 日與大家見面,屆時多位數據與數據庫技術領域大咖將到現場分享自己項目經驗,歡迎感興趣的小伙伴點擊下文鏈接,報名參會!

參會報名,請訪問: https://www.bagevent.com/event/8387611

全球開源技術峰會(Global Open-source Technology Conference),簡稱 GOTC,是由開放原子開源基金會、上海浦東軟件園、Linux 基金會亞太區和開源中國聯合發起的,面向全球開發者的一場盛大開源技術盛宴。 5 月 27 日至 28 日,GOTC 2023 將于上海舉辦為期 2 天的開源行業盛會。大會將以行業展覽、主題發言、專題論壇、開源市集的形式展現,與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區塊鏈等熱門技術主題,以及開源社區、AIGC、汽車軟件、AI 編程、開源教育培訓、云原生等熱門話題,探討開源未來,助力開源發展。

GOTC 2023 報名通道現已開啟,誠邀全球各技術領域開源愛好者共襄盛舉!

進入官網了解更多信息,請訪問: https://gotc.oschina.net/

標簽:


        
精彩推薦

 

主站蜘蛛池模板: 西西人体www44rt大胆高清| 明星ai换脸资源在线播放| 黄色a级片电影| 深夜福利影院在线观看| 国产美女久久精品香蕉69| 四虎色姝姝影院www| 大片毛片女女女女女女女| 中国胖女人一级毛片aaaaa| 波多野结衣护士无删减| 久草香蕉| 久久精品一区二区三区不卡| 深夜福利gif动态图158期| 草草影院国产| 男男动漫全程肉无删减有什么| 久草国产电影| 爱情岛亚洲论坛在线观看| 免费毛片在线视频| 欧美日韩一级二级三级| 四虎成人影院网址| 三级极精品电影| 亚洲一本高清| 日本公与熄乱理在线播放370 | 大陆黄色a级片| 夜夜操天天| 免费看美女部位隐私直播| 日本中文字幕第一页| 黄a在线观看| 娇妻的大杂交| 国产精品jvid在线观看| 亚洲午夜一区二区电影院| 波多野结衣在线一区二区| 精品无码久久久久久久动漫| 国产大片黄在线观看| 嗯嗯啊在线观看网址| 国产亚洲婷婷香蕉久久精品 | 里番库全彩本子彩色h琉璃| www.爱情岛论坛| lover视频无删减免费观看| 天堂√在线中文最新版| 亚洲午夜一区二区电影院| 亚洲日韩精品欧美一区二区|