虎嗅·商業有味道
9min1 w ago
播放聲音
喜歡
評論
分享

詳細信息

本文是虎嗅 《AI星火》系列的第7篇稿件,今天故事的主人公RWKV創始人彭博,在Transformer架構大行其道的當下,他一個人花了三年時間構建了RWKV架構——一種不同於Transformer架構的RNN架構。 在諸多大模型公司都選擇與OpenAI相同的Transformer架構時,彭博用了三年時間走上了另一條路,將Transformer改寫成RNN形式,保留了較低的時間空間復雜度。 值得一提的是,雖然他們走的是完全不同於OpenAI的路子,但2023年春節,彭博收到了“競對”OpenAI的入職邀請。元始智能聯合創始人羅璿解釋說,這能夠說明他們確實有顛覆OpenAI的可能性,而這個offer更像是一張用以招安的投名狀,是對彭博一種另類的“認同”。 但業內也有一些聲音,認為RWKV架構與Transformer架構並没有本質上的區别。 本期,我們來聽聽彭博的非主流大模型的誕生之路。 【時間軸】 00:10 非主流大模型RWKV 01:52 少有人走的路 05:19 跳出被動循環 07:27 非共識的相遇

查看更多