導(dǎo)語:在眾多被賦能的行業(yè)中,AI+投研,成為了一個(gè)炙手可熱的賽道。
準(zhǔn)確預(yù)測未來,并在關(guān)鍵時(shí)刻扼住命運(yùn)的咽喉,做出正確的決定。
這是無數(shù)人夢寐以求的情景。
得益于算法的進(jìn)步,這樣的現(xiàn)實(shí),正離人類正越來越近。
2012年,美國康涅狄格大學(xué)生態(tài)學(xué)和數(shù)學(xué)教授彼得·圖爾欽(Peter Turchin)在《和平研究雜志》上發(fā)表了一篇研究論文,提出一個(gè)不祥的預(yù)測:美國將在2020年迎來社會(huì)動(dòng)蕩的“高峰”。
結(jié)果,美國真在2020年迎來了“大亂”。
疫情、種族沖突、金融危機(jī),將整個(gè)社會(huì)攪成了一鍋粥。
那這位叫圖爾欽的教授,為何預(yù)測得這么準(zhǔn)?
原因就在于,他本人是一個(gè)“數(shù)據(jù)史學(xué)”的忠誠信徒。
所謂“數(shù)據(jù)史學(xué)”,簡單來說,就是搜集歷史上的各種關(guān)鍵數(shù)據(jù),如人口、收入水平、暴力事件的頻次等等,之后通過大數(shù)據(jù)+機(jī)器學(xué)習(xí)的方式,對(duì)其進(jìn)行建模、分析,從中預(yù)測出未來的趨勢。
用這樣的分析方式,圖爾欽甚至算出,平均50年,美國就會(huì)經(jīng)歷一次“動(dòng)亂周期”。
除了用來分析“天下興亡”之外,這樣的技術(shù)思路,也擴(kuò)展了一個(gè)需求龐大的賽道——機(jī)器(AI)數(shù)據(jù)分析。
根據(jù)MarketsandMarkets的報(bào)告,全球機(jī)器數(shù)據(jù)分析市場規(guī)模在2020年達(dá)到了14.8億美元,預(yù)計(jì)到2025年將增長至45.4億美元,期間年復(fù)合增長率(CAGR)為28.3%。
而在眾多被賦能的行業(yè)中,AI+投研,成為了一個(gè)炙手可熱的賽道。
數(shù)據(jù)煉金術(shù)
2023年至今,全市場一共開了52,400場投研會(huì)議,差不多每天200場。在信息爆炸的年代,信息降噪、提純成為投研人士的新剛需。
為此,在互聯(lián)網(wǎng)時(shí)代的早期,就有不少投研機(jī)構(gòu)、平臺(tái)開始用數(shù)據(jù)模型的方式,來分析龐雜的金融數(shù)據(jù)。
其中,最著名的就是彭博社推出的Bloomberg Terminal(彭博終端),這是一個(gè)為金融專業(yè)人士提供實(shí)時(shí)金融數(shù)據(jù)、新聞和分析的平臺(tái)。
通過預(yù)構(gòu)建的金融模型和指標(biāo),例如財(cái)務(wù)比率、估值模型、風(fēng)險(xiǎn)分析模型,以及各種圖表和可視化工具,Bloomberg Terminal可以分析來自300多個(gè)交易所和500多個(gè)數(shù)據(jù)提供商的數(shù)據(jù),從而幫助投資者實(shí)時(shí)了解市場動(dòng)態(tài),制定投資策略。
除此之外,S&P Capital IQ也是基于類似的技術(shù)思路研發(fā)的分析工具。
在提供了各種預(yù)制的財(cái)務(wù)模型模板,例如貼現(xiàn)現(xiàn)金流(DCF)模型、比較公司分析模型之外,用戶還可以利用插件直接在Excel中調(diào)用S&P Capital IQ的數(shù)據(jù),利用Excel的公式和功能進(jìn)行深入的財(cái)務(wù)分析。
從功能和分析方式上來說,這些平臺(tái)大多都是以預(yù)設(shè)的模型、算法,結(jié)合財(cái)務(wù)報(bào)表、歷史交易數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),對(duì)金融市場的走向進(jìn)行分析。
盡管這些終端都在努力整合、處理大量金融數(shù)據(jù),但在技術(shù)層面上,其仍存在著各種局限,而其中最大的局限之一,就是對(duì)非結(jié)構(gòu)化數(shù)據(jù)(如新聞、研究報(bào)告等)相對(duì)薄弱的處理能力。
對(duì)于金融數(shù)據(jù)來說,結(jié)構(gòu)性的數(shù)據(jù)(如財(cái)務(wù)報(bào)表、交易記錄等),只是浮在海面上的一小層冰山。而更多的非結(jié)構(gòu)性文本(新聞、社交網(wǎng)絡(luò)信息),才是隱藏在海面之下的,價(jià)值更大的冰山。
這是因?yàn)?,隨著互聯(lián)網(wǎng)的不斷普及,大量的文本信息被生成并存儲(chǔ)在網(wǎng)絡(luò)空間中。
根據(jù)皮尤研究中心(Pew Research Center)的一項(xiàng)研究,從2008年到2018年,全球金融新聞報(bào)道的數(shù)量增長了約40%。這些報(bào)道涵蓋了股票、債券、外匯等各種市場動(dòng)態(tài)。
然而,想要挖掘這些文本數(shù)據(jù)組成的“金山”,就需要運(yùn)用如自然語言處理、大數(shù)據(jù)分析等先進(jìn)的技術(shù),才能從非結(jié)構(gòu)性的文本中,提取有價(jià)值的信息。
為此,不少以自然語言處理技術(shù)(NLP)為核心的投研AI紛紛涌現(xiàn),由此開啟了金融數(shù)據(jù)分析的一個(gè)新階段。
化簡為繁
當(dāng)下的大模型+金融賽道,入局者甚多。
然而,在NLP技術(shù)沒有絕對(duì)性差距的情況下,要想在以自然語言處理技術(shù)為核心的投研AI中脫穎而出,高質(zhì)量、多樣化且實(shí)時(shí)更新的金融數(shù)據(jù)源,就成了競爭中的關(guān)鍵。
因?yàn)閿?shù)據(jù)的質(zhì)量和多樣性,將直接影響到分析結(jié)果的準(zhǔn)確性和可靠性。
而在這方面,熵簡科技,試圖站到行業(yè)的前列。
“熵”是熱力學(xué)中描述系統(tǒng)混亂、無序的程度。
“熵簡” 寓意以技術(shù)手段簡化業(yè)務(wù)數(shù)據(jù)的復(fù)雜度,用“化繁為簡”的方式,幫助用戶在數(shù)據(jù)中獲得洞察。
而其研發(fā)的新一代智能引擎AlphaEngine,就是這種理念的最佳體現(xiàn)。
AlphaEngine不僅聚合了海量優(yōu)質(zhì)商業(yè)情報(bào)數(shù)據(jù)源,內(nèi)涵三大商業(yè)數(shù)據(jù)庫,并且深度融合AI能力,能夠幫助用戶在海量數(shù)據(jù)中快速獲取洞察。
具體來說,AlphaEngine內(nèi)涵的三大商業(yè)數(shù)據(jù)庫,分別是會(huì)議紀(jì)要數(shù)據(jù)庫、研究報(bào)告數(shù)據(jù)庫、行業(yè)經(jīng)濟(jì)數(shù)據(jù)庫。
其中的會(huì)議紀(jì)要數(shù)據(jù)庫,不僅會(huì)提供全面的會(huì)議紀(jì)要數(shù)據(jù)庫,包括主流券商電話會(huì)議、調(diào)研會(huì)議紀(jì)要、專家訪談紀(jì)要等一手研究資料。
而研究報(bào)告數(shù)據(jù)庫,則了涵蓋主流券商研報(bào)、產(chǎn)業(yè)咨詢報(bào)告、外資券商研究報(bào)告等專業(yè)投研資料。具有多種篩選器,方便用戶定位所需資料。
同時(shí),為了使用戶在大量數(shù)據(jù)中,高效找到需要的信息,AlphaEngine提供了多種篩選器,通過使用高效的信息檢索技術(shù)和數(shù)據(jù)挖掘方法,使用戶能夠輕松地在大量數(shù)據(jù)中找到所需資料。
在AlphaEngine中,以NLP技術(shù)為核心的生成式AI,被用于文本預(yù)處理、查詢處理、語義理解等環(huán)節(jié)。通過使用NLP技術(shù),AlphaEngine能夠更好地理解用戶查詢和文檔內(nèi)容,從而提高信息檢索的準(zhǔn)確性和效率。
而在文本摘要、總結(jié)方面,熵簡科技通過FinGPT大模型,實(shí)現(xiàn)了自動(dòng)化生成AI摘要,從而讓用戶能方便、快速地獲取會(huì)議中的關(guān)鍵信息。
在瀏覽行業(yè)報(bào)告時(shí),AlphaEngine內(nèi)嵌的生成式AI,會(huì)自動(dòng)將報(bào)告中的要點(diǎn)、關(guān)鍵信息進(jìn)行總結(jié)、提煉,在節(jié)約了用戶視角的同時(shí),從而讓用戶在整體上對(duì)報(bào)告的核心內(nèi)容有了清晰的認(rèn)知。
除此之外,針對(duì)一些較為重要的會(huì)議、演講,AlphaEngine也能將會(huì)議錄音轉(zhuǎn)錄成文本,并且形成會(huì)議摘要,并支持定位播放及摘要溯源功能,方便用戶快速獲取會(huì)議關(guān)鍵信息。
AlphaEngine除了提供三方海量會(huì)議紀(jì)要外,也可以用于構(gòu)建屬于自己的AI知識(shí)庫。
在【知識(shí)庫】模塊中,可以整理任何類型的研究資料,大模型會(huì)自動(dòng)進(jìn)行音頻轉(zhuǎn)寫及全文摘要,包括但不限于PDF、Office文檔、音頻、視頻等格式的文件。
也可以對(duì)任意資料進(jìn)行提問,讓大模型根據(jù)資料中的信息做出專業(yè)解答。
對(duì)于手機(jī)上發(fā)現(xiàn)的優(yōu)質(zhì)研究資料,只需把這篇文章轉(zhuǎn)發(fā)到微信助手,AlphaEngine會(huì)將文章自動(dòng)同步至知識(shí)庫中存檔,可以在【個(gè)人中心】-【微信助手】中進(jìn)行設(shè)置。
上述的技術(shù)特點(diǎn),展現(xiàn)了熵簡在處理非結(jié)構(gòu)性金融數(shù)據(jù)時(shí)的巨大優(yōu)勢。
隨著生成式AI的重大進(jìn)展和衍生應(yīng)用帶來的領(lǐng)域拓寬,可以想見,未來熵簡也將在AI+數(shù)據(jù)分析的賽道上,研發(fā)出更多有價(jià)值的技術(shù)或產(chǎn)品。
而這種基于AI的數(shù)據(jù)分析技術(shù),也是當(dāng)下處于飛速變化中的社會(huì)所期待和需要的。
畢竟,在劃時(shí)代的機(jī)遇來臨時(shí),唯有敏銳地捕捉變化,洞察先機(jī),才能找到在新時(shí)代的生存發(fā)展之道。
-
AI
+關(guān)注
關(guān)注
87文章
29414瀏覽量
267711 -
數(shù)據(jù)模型
+關(guān)注
關(guān)注
0文章
48瀏覽量
9992 -
生成式AI
+關(guān)注
關(guān)注
0文章
472瀏覽量
437
原文標(biāo)題:生成式AI,如何從研究里“掘金”?
文章出處:【微信號(hào):alpworks,微信公眾號(hào):阿爾法工場研究院】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論