今天小編(郟君昊)要和大家分享的是“充電廠商”為何跨界AI眼鏡?對話閃極創始人張波,歡迎閱讀~
AI 眼鏡,究竟為什麼這麼熱?
自 2023 年 10 月 Meta 旗下的 Ray-Ban Meta 智能眼鏡發布,标志着智能眼鏡終端不再只是極客的玩具,而是可能成為繼智能手機之後,人類與數字世界互動的下一個核心入口。
截至目前,國内已有十餘家廠商正式發布了 AI 眼鏡產品,還有更多的產品正等待亮相," 百鏡大戰 " 的序幕已經拉開。
這場大戰之中,參賽選手屬性各不相同,既有互聯網廠商,也有做顯示出身……不同類型的選手都是以一種怎樣的姿态加入的這場戰鬥?
為了解開這些疑問,量子位與不同屬性的 AI 眼鏡從業者進行了對話交談。
今天的文章是這一系列交流中的第二期,我們對話了閃極科技創始人兼 CEO 張波先生。
在做 AI 眼鏡之前,閃極科技以其電池和充電產品而聞名,因此也被外界看做 AI 眼鏡的 " 跨界選手 "。
當然,閃極内部對此有不同的看法,但可以肯定的是,做電池的經歷給閃極在 " 百鏡大戰 " 中帶來了獨特優勢。
閃極為什麼要做 AI 眼鏡?他們理想當中的 AI 眼鏡又是怎樣的一種形态?
來看這位 " 跨界選手 " 心目中的藍圖。
核心要點
AI 眼鏡要擁有 " 記憶 ",能夠主動成為用戶的 " 個人助理 ";
目前圖形界面的 UI,不适合做成 AI 眼鏡的顯示;
AI 眼鏡的關鍵在于全天候使用," 大而全 " 不是終極目的;
小米等大廠的入局,會讓整個行業變得更加繁榮。
以下為量子位與張波對話實錄,部分内容有删改。
讓 AI 眼鏡成為有記憶的 " 個人助理 "
量子位:自從產品發布以來,閃極眼鏡的 AI 功能有沒有什麼新的迭代?下一步的更新計劃是什麼樣的?
張波:首先是接入了更多的模型,包括春節期間我們把 DeepSeek 也接進來了。
另外就是我們把我們的智能體的商店也做得更全面了,比如說我們有導遊的 Agent,可以通過拍照的方式幫你解讀沿途的景物,包括背後的文化、歷史。
而且我們雲端的鏈路也優化得更流暢了,整個響應的全流程都做了軟硬體一體的效率優化。
第三,在功能上我們想做一些主動的 AI,比如說我們現在有一個模式是如果你打開它,那麼每隔幾分鍾它就會拍一張照片,然後用 AI 去歸納、匯總、整理。
而且在拍照的同時,如果有人聲出現的話,它就可以持續地錄一段音,把有效的聲音信息也記錄下來,這種主動地去記錄聲音和畫面信息,形成一個助理型 AI 的歸納整理。
這個是我們在去深入開發和優化的部分,就是讓它成為一個真正過目不忘的助理。
量子位:閃極提出的這種 AI 記憶存儲,成本還是比較高的,閃極會不會考慮采用訂閱模式?用戶的訂閱習慣需要如何培育?
張波: 我們的基礎功能—— AI 問答,包括多模态的問答,肯定還是不收費的,因為這個服務成本可以不斷地去優化和降低。
但是像長期的記憶和專屬歸納整理、檢索,最終還是要走向收費的,否則成本會持續增加。
我們可以通過幾個機制去來去平衡,第一就是前期是先免費,後期(收費期)用戶可以通過打卡或者社交平台曬單分享的方式獲得抵用券,或者累加免費的時長、容量。
我們規劃中的價格是 299 一年,但是實際大家通過打卡獲得優惠之後,實際的價格大概在 100 元左右。
但是就算不付費,輕度的問答和有限容量的記憶都還是可以用的。
量子位: 剛才您也提到了閃極今年會接入更多的模型,當然對于用戶來說多幾種選擇不是壞事,但是模型一多就可能會存在一個調度問題。另外有些廠家采用了定制化的模型,相對來說和系統、硬體的融合程度會更好。
所以,閃極目前設定的模型接入方式背後都有哪些考量?如何解決背後的一些潛在問題?
張波: 我認為,定制化模型主要的目的是讓模型在更細分的方向上做得更好,但是現在用戶數量還不夠多,還沒有看到特定的高頻場景,能夠支持我們去做定制模型。
但是這并不代表閃極沒有這樣的能力,當前這個階段我們會積累數據,以便為未來定向訓練更适合個人助理的模型做準備。
我們現在已經在模型上有了布局,去年 Tensorflow 團隊發布的一個新的強化記憶的模型,它可以讓整個 Transformer 架構在不用重訓練的情況下,就是具備一定的記憶能力。
這跟我們要做強記憶的模型是不謀而合的,所以在探索新的模型架構,而不是在現在 Transformer 的基礎上去做,因為想讓 Transformer 有記憶的話訓練成本太高了,我們現在都是通過外挂降數據庫的形式去實現。
但是最終,我們還是希望這些記憶能夠直接融入到模型本身,當然還有很多工作要做,我們也正在努力。
關于我們接入的不同模型,的确每個模型在我們的測試項中展示的特長不一樣,比如說通義千問對于各種復雜的圖片的多模态識别就會更精确一些;但是如果是在這種拟人的對話和情感的對話上面,可能豆包的模型就會更好一些;如果是像生物識别,比如說識别植物和動物的門綱目科屬種,那可能就會用科大訊飛的植物識别模型。
所以在調用模型時我們會基于功能進行分配,另外也要看系統的響應,因為所有的模型都有抖動,我們會不斷地地去測試這些模型伺服器的響應的情況,調用響應更好、更及時的模型。
量子位: 您之前在其他的訪談中提到過,希望 AI 眼鏡能夠融入互聯網平台,擴大 " 朋友圈 "。所以閃極現在眼鏡產品與第三方平台的生态合作上,有沒有什麼新的進展?
張波: 第一,我們肯定希個眼鏡它有更多、更直接的用戶行為習慣數據導入,所以我們和網易雲音樂、 QQ 音樂都談了新的合作,希望可以直接拉取歌單,更好地判斷用戶在視聽習慣上的喜好,這個會在下一個版本中可以更新出來。
第二個是在 AI 的存儲歸納總結上,我們發現有些筆記類的應用,都有一些非常好的一些模板和接口,這個也是我們在打通和調用的。
第三,眼鏡也好,還是其他硬體也好,最終還是需要把拍的東西傳播和分享出去。所以我們和小紅書、微博等社交媒體都在探讨 " 一鍵分享 ",最終我們希望成為 AI 的 APP store,所以這個軟硬體的權限也是開放的,可以支持更多的開發者在我們的產品上面開發的原生 AI 應用。
并且溝通下來這些廠商的态度也是比較積極的,因為其實是增加用戶活躍度和内容產出的一個新渠道,當然也面臨着一些技術和法律問題,我們會持續溝通、推進。
AI 眼鏡和顯示之間,還差一個新的用戶界面
量子位: 閃極曾經表示過,在 "AI 重構 UI" 之前不會做顯示部分。請問您對于這個 " 重構 " 的定義是什麼樣的?
張波: 現有的所有的 UI 互動都是基于圖形化的顯示界面,人和機器之間的溝通是通過操作界面去完成的。
但是 AI 互動基本上是純對話,最多只要再加一些圖片就 OK 了,互動過程就是一種對話流,所有的展示都是在一個網頁或者在一個對話框裡完成。
所以,等到用戶最終覺得這種實時生成的對話内容,可以滿足信息獲取需求的時候,那我們就可以在眼鏡上基于這種實時對話流的形式,去增加顯示的功能。目前我覺得一個關鍵的點,是大家能不能針對這種 AI 的瀑布流的顯示達成共識。
另外顯示現在還面臨一個問題,就是在眼鏡上做超輕量的顯示,它的功耗、體積都不是特别的能夠滿足全天候佩戴的需求,那我們肯定還是要做精簡。
量子位:您認為無顯示或輕量化顯示的 AI 眼鏡,和帶有 AI 功能的 AR 眼鏡,這兩種硬體形态的用戶群體分别是什麼樣子的?
張波: AR 眼鏡的其中一種形态,就是作為顯示設備的便攜式替代,最大的目标群體還是遊戲用戶,大家把它當成遊戲機等娛樂設備的副屏。這個肯定不是我們想做的,我們還是希望做一個具有獨立算力和全部系統權限的、類似于小手機的一種眼鏡硬體。
還有一種是光波導,但是做光波導的廠商現在還沒有特别大量的出貨,可能兩三千台就是現在單一品牌的極限,還沒有形成規模效應,用戶人群也很難收斂出來。大多數用戶依然、把它當玩具,當一個新奇的體驗在用,而沒有能夠貢獻出生產力或者娛樂上的價值。
目前來看,閃極未來的演進方向,還是希望在記錄和個人助理的層面上給大家貢獻一點生產力的價值,我們希望眼鏡能幫大家記錄跟人溝通了什麼、講了什麼、做了什麼。
量子位: 如果讓您來暢想一下我們 AI 眼鏡產品的終極形态,您認為會是一個什麼樣子? 張波:我認為是讓大家每天佩戴起來沒有什麼負擔,但是在雙手都被占據的時候又可以完成絕大多數的人機互動。不管是信息提示、AI 問答,還是一些主動的處理型的内容,都有點像一個手表手環的存在,但是能比手表手環帶來更強的人機互動和生產力的價值。
這就是它一個比較理想的狀态,可能是在未來三到五年内實現的。
如果說更遠的未來就是,那 AI 眼鏡可能人類增強自己能力的最佳硬體,最終 AI 和人類肯定是要相互賦能的,那就必須有一個介質。
終極的介質可能是腦機接口,但是很多人可能不希望使用侵入式的腦機接口,那麼随身佩戴的眼鏡就成了增強人機互動的最佳硬體載體。
不做 " 大而全 ",關鍵在使用全天候
量子位: 所以您認為就是決定 AI 眼鏡類成產品能不能成功的最關鍵的因素是什麼?
張波: 我覺得最關鍵的因素還是讓用戶覺得它真的有用,能夠在生活中默默地、主動地幫用戶做一些事情。
如果需要人類去指揮的話,手機這種互動形式肯定還是更加的符合大家的直覺,學習成本也更低的。
所以我們要做在手機上做不到的事情,它實時在看、在錄,幫人做好歸納總結,這是我們在努力的方向。
量子位:您認為閃極的產品在這場 " 百鏡大戰 " 中最大的優勢是什麼?
張波:我們最大的優勢,第一就是我們在充電技術上的積累,可以讓我們這個眼鏡的續航更長,這樣它就可以更長的陪伴和記錄。
第二就是我們在 AI 的記錄存儲和總結上面投入了很大的開發資源和精力,我們現在已經可以做到第一梯隊,并且我們會持續地加強。
第三是我們有一批非常願意嘗新的用戶,可以讓我們更好地去快速完成驗證。
量子位:剛才您也提到了電池的優勢,确實閃極也是從做電池和充電設備跨界過來的,并且這個跨度還是比較大的,但所以選擇做 AI 眼鏡是基于什麼樣的考量?
張波: 我想澄清一點,這個跨度可能在外界看來确實很大,但在我們内部看并不算大。
因為我們在做充電之前是做過手機和無人機,并且做無人機的合夥人他之前就在無人機的頭部廠商做超輕量的顯示設備,所以在這一塊上面我們的技術能力和積累是足夠的。
我們之所以做這個方向,是因為我們發現在 AI 時代到來之後,必須有一種新的互動硬體,才能充分地發揮 AI 的能力。
在各種穿戴設備,比如滑鼠、軸環、挂飾、眼鏡、耳機等這些當中随便選,那麼眼鏡無疑是陪伴人時間最長的,而且它的算力和電力都更充分,能夠一直符合人的第一視角的感觀,綜合起來就是我們就最終決定要做 AI 眼鏡的原因。
量子位: 您之前曾經說過閃極要把 AI 眼鏡的價格做到 " 雷軍也做不到的水平 ",那麼閃極是如何實現成本控制的?
張波: 第一是更多地選用國產芯片,雖然做 3 納米、4 納米的手機處理器可能還比較難,但是做一個手表、手環級别的處理器,國内的技術還是很成熟的,所以我們會跟國内優秀的芯片供應商做配合。
另外就是我們也重構了整個架構。之前的各種眼鏡都是單芯片優化,主控芯片即使在不工作的時候功耗也很高,所以我們就通過協處理器,通過超低功耗的待機和喚醒,實現續航的增長。
當然成本降低還也有賴于整個供應鏈的支持,因為整個供應鏈都認可這的确是未來的方向,大家願意幾乎不掙錢甚至倒貼的陪我們一起玩,希望能夠盡快地做出一個爆款的產品,讓整個市場能夠對更多的用戶對這個產品感興趣。
所以我們在努力做這個方向上的成本的優化,供應商也很配合,大家一起努力把成本做到最低。
量子位:您剛才提到了供應鏈,AI 眼鏡作為一個新的物種,在大眾看來打通供應鏈并非非常容易的事,所以好像跟您剛才說的就是有一點出入?
張波: 一個產品的落地肯定是妥協的結果,沒有人可以做到完美,哪怕是 iPhone,第一代也有很多不完美的地方,所以關鍵是怎麼實現預期和實際狀況之間的平衡。
大家肯定都想做個完美的產品,但是技術和硬體達不到要求的時候,是很難實現的。具體到我們,的确在對于整個芯片方案的優化、攝像頭聲音的算法上還有提升空間。這是一個工程上的難題,而不是一個科學的難題,那就給出時間、給出目标、給出資金和人力,大家去努力完成就好了。
量子位:前兩天就是小米也剛剛宣布了他們的 AI 眼鏡,您怎麼看待小米的入局呢?
張波:我覺得這是一個非常好的事情,因為雷總的帶貨能力還是超過很多人的,只會讓這個行業越來越好。
量子位:您對于認為目前這個整個 AI 眼鏡市場的發展最大的限制因素是什麼?
張波:我認為是 AI 眼鏡這種產品,大多數人都還沒見過,甚至不知道有這個東西存在。
要想解決這個問題,單靠我們一家是很難扭轉整個市場和消費者的認知的,所以這需要整個行業一起向前進步,然後讓大家意識到這種新型產品形成整個產業鏈,可能也需要有大廠在這個方面去發聲,讓更龐大的人群能夠了解這樣的產品。
量子位:有的廠商,特别是 AR 廠商認為 AI 眼鏡的最終形态,就是全彩顯示、空間計算等等趨勢融合全部都融進來,您覺得這個判斷是對的嗎? 張波:我認為一個設備如果能夠獲得用戶的注意力,那所有的資金和資源就會向它集中。就像手機上面抖音越來越搶占大家用戶的注意力,那它的規模就越來越龐大。
還是要強調,這個產品必須是能夠全時段陪伴用戶的,一旦做了 " 大而全 ",在物理重量上用戶就不一定能夠接受,在各種場景下它的續航也不一定能扛得住。
所以我覺得這個產品就是如果做得 " 大而全 ",它就無法符合全場景的使用需求,也就更難衍生出更強的商業化的價值。
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
速搶席位!中國 AIGC 產業峰會觀眾報名通道已開啟 ♀️
最新嘉賓曝光啦 百度、華為、AWS、無問芯穹、數勢科技、面壁智能、生數科技等十數位 AI 領網域創變者将齊聚峰會,讓更多人用上 AI、用好 AI,與 AI 一同加速成長~
4 月 16 日,就在北京,一起來深度求索 AI 怎麼用
一鍵星标
科技前沿進展每日見
關于“充電廠商”為何跨界AI眼鏡?對話閃極創始人張波就分享完了,您有什麼想法可以聯系小編(郟君昊)。