0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新火種AI|大廠圍剿,“長文本”成不了Kimi的護(hù)城河

新火種 ? 來源:新火種 ? 作者:新火種 ? 2024-03-28 22:37 ? 次閱讀

作者:一號

編輯:美美

長文本之后,Kimi能找到新的“護(hù)城河”嗎?

過去的一周,由AI技術(shù)天才楊植麟的大模型初創(chuàng)企業(yè)月之暗面及其產(chǎn)品Kimi所帶來的連鎖反應(yīng),從社交媒體一路沖向了A股,帶動了一批“Kimi概念股”的大漲。這也是國內(nèi)AI創(chuàng)業(yè)公司第一次真正意義上的“破圈”。

資本市場的關(guān)注,也讓Kimi迎來了用戶量的飆升,根據(jù)“AI產(chǎn)品榜(aicpb.com)”的數(shù)據(jù),Kimi智能助手在2024年2月份的訪問量達(dá)到了305萬,比上個月增長了107.6%,3月8日至3月14日的周訪問量更是達(dá)到了183萬,環(huán)比增加了45%。流量的激增,也讓Kimi在3月20日出現(xiàn)了宕機(jī)等異?,F(xiàn)象。

wKgaomYFgLuACvBaAAIio0T9ObA722.jpg

而這一次的爆火始于3月18日,月之暗面宣布其自研的Kimi智能助手在大模型上下文窗口技術(shù)上取得了新的突破,已支持200萬字超長無損上下文,并即日起開始產(chǎn)品內(nèi)測。我們不禁要問,大模型能力這么多,為何長文本會成為引爆點?

為什么長文本是用戶的痛點?

對于大模型的長文本的能力,月之暗面的創(chuàng)始人楊植麟把它解讀為“新計算范式”,并認(rèn)為通用的世界模型,是需要“長文本”的。

想象一下,如果你把一個大模型當(dāng)做一個和你對話的人,它跟我們一樣,有短期記憶和長期記憶。而長期記憶就是它通過模型訓(xùn)練得到的向量和參數(shù),你可以把這當(dāng)成它的知識庫。而上下文就是它的短期記憶,當(dāng)你在和它對話的時候,你們之間的對話內(nèi)容就是以上下文窗口的形式提供給了大模型,要是你們的對話長度超過了這個它的上下文承載能力,那么超出的部分,大模型就會忘記。這從根本上就限制了大模型處理一些復(fù)雜多變的任務(wù)的可能。

wKgZomYFgLyAfnCgAADjOOD9gdw820.jpg

為了讓大模型能夠完成更多的任務(wù),或者說讓它不會在跟你對話過程中突然就沒辦法跟你繼續(xù)對話下去了的問題,拓展上下文就成了一件必須解決的事情。也只有這樣,AI才能在面對一些描述非常復(fù)雜,需要舉例幫助模型進(jìn)行學(xué)習(xí)等的任務(wù)上表現(xiàn)得更好。如果以AGI為目標(biāo),那上下文長度的突破更是必須的。

而從市場上看,當(dāng)前使用大語言模型的大多數(shù)人群,無論是泛科技行業(yè),還是從業(yè)者、愛好者或者學(xué)生,解讀論文、深度研報還有會議摘要等這些明確的應(yīng)用場景,長文本能力都是剛需。因此,OpenAI的開發(fā)者關(guān)系經(jīng)歷Logan Kilpatrick就曾經(jīng)說過,“上下文就是大語言模型的下一個關(guān)鍵突破”。

因長文本而備受關(guān)注的Kimi

很明顯,月之暗面“登月”的第一步,從用戶需求的角度上來講,肯定是邁對了。早在2023年10月,Kimi剛剛上線的時候,它就以一個很有辨識度的方式進(jìn)行了亮相。他們在官宣文章的標(biāo)題上,別出心裁地用了“歡迎與Moonshot AI共同開啟Looooooooooong LLM時代”,通過加了很多個“o”的long,從視覺上就讓人印象深刻,明白這個大模型與“長”相關(guān),然后文章的第一句就是“今天,Moonshot AI 帶著首個支持輸入 20 萬漢字的智能助手產(chǎn)品Kimi Chat 與大家見面了”。

wKgaomYFgLyAQItnAAHyhlqEAII350.jpg

這些宣發(fā)內(nèi)容,都讓人能夠很快地將“長文本”和Kimi之間構(gòu)建起聯(lián)系,通過這樣的營銷方式,月之暗面輕松地占領(lǐng)了用戶心智,從此要是聊起“長文本”,“月之暗面”就成了一個很容易被提到的公司。

在當(dāng)時不?!熬怼钡拇竽P褪袌錾?,新模型不斷冒出,而絕大部分的模型介紹都有這么一套標(biāo)準(zhǔn)動作:公布模型參數(shù)、模型是開源還是封閉的、公布測試集成績,體現(xiàn)自己成績有多好,然后就是一些業(yè)內(nèi)人士的介紹或評測文章。

雖然數(shù)據(jù)清晰,但如果是面向大眾市場,顯然這些晦澀難懂的參數(shù)和技術(shù)詞語,只能是自嗨,遠(yuǎn)不及一個直白的特點更讓人印象深刻。因此月之暗面用這樣的具有辨識度的方式,很輕松地就從一眾大模型中脫穎而出,輕松地贏得了普通用戶的心。

wKgZomYFgLyABccbAAB_bKe60o4689.jpg

而且在后續(xù)的宣發(fā)中,月之暗面也在不斷重復(fù)和強(qiáng)調(diào)kimi的長文本能力,直到最近,它所做的突破也是在長文本這個能力上。因此,當(dāng)用戶將長文本=Kimi的時候,除非競爭對手擁有碾壓級的實力,否則都很難威脅到Kimi在用戶心中的地位。

但“長文本”真的能保Kimi永久平安嗎?

長文本成不了Kimi的“護(hù)城河”

同樣在長文本上做文章的,在海外,還有一家名為Antropic的公司。作為被公認(rèn)的OpenAI最強(qiáng)大的對手,他們的大模型Claude的殺手锏就是長文本。在其初代模型推出時,就支持100k token的上下文,可以直接處理5萬字,這也讓它一直在整體性能劣于OpenAI的情況下,也能保有一群核心粉絲。

wKgaomYFgL2AUvV7AABzS2Dw_w8440.jpg

然而這種優(yōu)勢也并未能保持太久。去年11月,OpenAI在Dev Day上發(fā)布了GPT-4 Turbo,支持128k的上下文,這讓Antropic陷入了危機(jī),不得不緊急推出Claude 2.1,將上下文從100k提升到了200k。但后來被人進(jìn)行了探針測試,顯示它只是支持了這樣的長度,但并未記住其中的內(nèi)容,使得它緊急打了補丁。而這個補丁,僅僅只是一句Prompt。

今年2月,谷歌的Gemini 1.5則直接將上下文推到了100萬。種種跡象都表明,長文本能力的“護(hù)城河”已經(jīng)在變淺。就在前段時間,Antropic號稱超越GPT-4的“世界最強(qiáng)大模型”Claude 3也放棄了在長文本上開卷,依然只支持200k的上下文,轉(zhuǎn)而在其他能力上進(jìn)行了升級。

wKgZomYFgL2ASXPvAAA7ZDQeVGU040.jpg

同樣,在國內(nèi),Kimi爆火之后,“長文本”的需求也被大廠看到了。很快,阿里巴巴宣布通義千問重磅升級,向所有人免費開放1000萬字的長文檔處理功能,成為了全球文檔處理容量第一的AI應(yīng)用;緊接著,百度的文心一言將在下個月開放200萬-500萬字的長文本能力;360智腦也正式內(nèi)測500字長文本處理能力。

wKgaomYFgL6AYs58AAAw6yfdpCM489.jpg

據(jù)新浪科技獲得的數(shù)據(jù),Kimi當(dāng)前每日獲客成本高達(dá)20萬元。面對大廠在長文本能力上的集體圍剿,作為AI創(chuàng)業(yè)公司的月之暗面,在資金還有算力資源上,都難以招架。因此,盡管當(dāng)前月之暗面仍有足夠的“忠粉”,但當(dāng)熱情褪去,若月之暗面還未挖出一條新的“護(hù)城河”,恐怕難逃困境。

作為“堅定的AGI信徒”,楊植麟也有過這樣的判斷,“獨特價值是你增量的智能。要抓住這個點,智能永遠(yuǎn)是最核心的增量價值。如果你這個產(chǎn)品最核心價值只有10%-20%來自于AI,就不成立”。

因此,究竟“智能”能否成為Kimi新的“護(hù)城河”,我們只能拭目以待。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29435

    瀏覽量

    267731
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    74

    瀏覽量

    10176
  • Kimi
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    38
收藏 人收藏

    評論

    相關(guān)推薦

    單日獲客成本超20萬,國產(chǎn)大模型開卷200萬字以上的長文本處理

    更精準(zhǔn)的推理和高并發(fā)流量以外,似乎已經(jīng)沒有太多值得廠商大肆宣傳的特性了,直到最近超長文本處理的爆火。 ? 國產(chǎn)大模型的新卷法,長文本處理 ? 當(dāng)下將大模型長文本處理炒熱的,無疑是來自月之暗面的
    的頭像 發(fā)表于 03-27 00:53 ?3256次閱讀
    單日獲客成本超20萬,國產(chǎn)大模型開卷200萬字以上的<b class='flag-5'>長文本</b>處理

    火種AI 大模型公司紛紛被收編!創(chuàng)始人們逐漸變成了“最討厭的自己”?

    谷歌,微軟一類的大廠正在快速展開行動,不過,它們并不是單純要給大模型公司進(jìn)行投資回血,而是對其展開了圍剿行動。 就在本月初,谷歌就“買下”了AI聊天機(jī)器人獨角獸公司Character.AI
    的頭像 發(fā)表于 08-21 15:05 ?216次閱讀
    新<b class='flag-5'>火種</b><b class='flag-5'>AI</b> 大模型公司紛紛被收編!創(chuàng)始人們逐漸變成了“最討厭的自己”?

    MiniMax推出“海螺AI”,支持超長文本處理

    近日,大模型公司MiniMax宣布,其全新產(chǎn)品“海螺AI”已正式上架。這款強(qiáng)大的AI工具支持高達(dá)200ktokens的上下文長度,能夠在1秒內(nèi)處理近3萬字的文本。
    的頭像 發(fā)表于 05-17 09:30 ?648次閱讀

    訊飛星火長文本功能全新升級

    科大訊飛近日宣布,其首個長文本、長圖文、長語音大模型已完成全新升級。這一大模型不僅具備強(qiáng)大的學(xué)習(xí)能力,可以快速吸收海量文本、圖文資料以及會議錄音等多元化信息,更能在各行業(yè)場景中提供精準(zhǔn)、專業(yè)的回答。
    的頭像 發(fā)表于 05-06 11:22 ?482次閱讀

    科大訊飛創(chuàng)新推出長文本、長圖文、長語音大模型,解決落地難題

    近期,科大訊飛推出了首個支持長文本、長圖及語音大數(shù)據(jù)處理的大模型,該系統(tǒng)融合了多元化數(shù)據(jù)源,包括海量文字、圖片以及會議音頻等,能為各行業(yè)場景提供專業(yè)化、精準(zhǔn)化的答案。
    的頭像 發(fā)表于 04-28 09:32 ?328次閱讀

    Kimi爆火背后的技術(shù)奧秘 大模型長文本能力的技術(shù)難點

    當(dāng)用戶認(rèn)為在國內(nèi)的大模型中,長文本=kimi的時候,除非競爭對手能以絕對的實力碾壓幾個量級,但凡與kimi打平或者是微弱超越,都很難威脅到kimi在用戶心目中的地位。
    發(fā)表于 04-17 10:11 ?1108次閱讀
    <b class='flag-5'>Kimi</b>爆火背后的技術(shù)奧秘 大模型<b class='flag-5'>長文本</b>能力的技術(shù)難點

    Kimi AI模型崛起 各大廠商競相效仿

    Kimi的出色表現(xiàn)自然吸引了各大廠商的密切關(guān)注,并紛紛效仿其做法。作為月之暗面推出的對話式AI產(chǎn)品,Kimi在技術(shù)上不斷創(chuàng)新和突破。
    的頭像 發(fā)表于 04-08 15:08 ?2573次閱讀

    圍剿Kimi,只是大模型“新賽季”play的一環(huán)

    Kimi能“亂拳打死老師傅”,一舉終結(jié)基礎(chǔ)大模型的比賽嗎?
    的頭像 發(fā)表于 04-05 01:16 ?3324次閱讀
    <b class='flag-5'>圍剿</b><b class='flag-5'>Kimi</b>,只是大模型“新賽季”play的一環(huán)

    stm32cubemx生成不了keil工程的原因?

    stm32cubemx生成不了keil工程
    發(fā)表于 03-21 06:00

    快速全面了解大模型長文本能力

    那關(guān)于LLM的長文本能力,目前業(yè)界通常都是怎么做的?有哪些技術(shù)點或者方向?今天我們就來總結(jié)一波,供大家快速全面了解。
    發(fā)表于 02-22 14:04 ?772次閱讀
    快速全面了解大模型<b class='flag-5'>長文本</b>能力

    火種AI|AI社交,大廠競逐的新戰(zhàn)場

    作者:一號 編輯:美美 AI時代的社交王者,這塊“蛋糕”誰都想吃下。 如果說QQ是中國互聯(lián)網(wǎng)時代的代表性社交產(chǎn)品,那么在移動互聯(lián)網(wǎng)時代,微信就是當(dāng)之無愧的移動互聯(lián)網(wǎng)社交王者。這一國內(nèi)社交產(chǎn)品巨頭
    的頭像 發(fā)表于 02-18 14:35 ?341次閱讀
    新<b class='flag-5'>火種</b><b class='flag-5'>AI</b>|<b class='flag-5'>AI</b>社交,<b class='flag-5'>大廠</b>競逐的新戰(zhàn)場

    什么是CUDA?誰能打破CUDA的護(hù)城河?

    在最近的一場“AI Everywhere”發(fā)布會上,Intel的CEO Pat Gelsinger炮轟Nvidia的CUDA生態(tài)護(hù)城河并不深,而且已經(jīng)成為行業(yè)的眾矢之的。
    的頭像 發(fā)表于 12-28 10:26 ?1.2w次閱讀
    什么是CUDA?誰能打破CUDA的<b class='flag-5'>護(hù)城河</b>?

    如何用AI聊天機(jī)器人寫出萬字長文

    如何用AI聊天機(jī)器人寫出萬字長文
    的頭像 發(fā)表于 12-26 16:25 ?1004次閱讀

    淺談IC工程師的護(hù)城河是什么?

    對IC工程師來說同理,日復(fù)一日地寫代碼、debug、畫圖走線,用這些來挖掘護(hù)城河是非常有限的。能緊跟先進(jìn)工藝流片、不斷積累學(xué)習(xí)協(xié)議和IP、接觸不同應(yīng)用場景的產(chǎn)品才行。
    的頭像 發(fā)表于 12-13 10:11 ?385次閱讀

    cubeMX怎么生成不了keil工程?

    cubeMX怎么生成不了keil工程
    發(fā)表于 10-31 06:42