科技前沿

运行LIama2得8400万元！最快AI推理芯片成本推算引热议 (运行linux需要什么配置)

admin 2025-01-09 次阅读

运行LIama2得8400万元！最快AI推理芯片成本推算引热议 (运行linux需要什么配置)

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

白交来源：量子位

英伟达GPU成本只需30万美元

想实现史上最快大模型推理，得要1171万美元（8410万元）？？？

同等项目下，使用英伟达GPU成本只需30万美元……

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

关于最强AI芯片易主Groq，可能得让子弹再飞一会儿了。

这两天，Groq惊艳亮相。它以号称“性价比高英伟达100倍”的芯片，实现每秒500tokens大模型生成，感受不到任何延迟。外加谷歌TPU团队这样一个高精尖人才Buff，让不少人直呼：英伟达要被碾压了……

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

喧嚣过后开始出现一些理智讨论，其中主要还是针对Groq的效益成本问题。

网友粗略一算，现在演示Demo就需要568块芯片，花费1171万美元。

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

于是乎，业内业外各界人士不约而同地展开了一场算术大法。

甚至出现了位分析师，拿着表格现身说法……

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

并感叹了句： OK，everybody is doing public math this week.

不过Groq也第一时间在社交网络上进行了回应。

“每个人都在做数学”

参与到Groq成本问题讨论的，有计算机学生，也有同提供推理服务的云厂商，甚至还有Groq前员工大战现员工……好不热闹。

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

摘取几个有代表性的，我们来看看大家都是如何看待的。

首先一个粗略估计，一张卡的价格约为2万美元，内存又仅为0.23GB。

那么为单个LLama 70B模型服务，就需要购买大约320张卡（实际上更多），包括服务器在内大约花费1千万美元……

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

而要是跟英伟达的H100对比，情况又是如何？

Lepton的贾扬清也参与进来，算了一笔账。除了基本价格，他还从能源功耗、性能、运营成本等角度进行了分析。

最终总结出这几个核心观点：

值得一提的是，在Groq给出的基准测试中，也包括了Lepton在内，推理速度大概是Lepton的三倍。

贾扬清还透露，他跟Groq创始人是旧相识了：

不过在这些讨论中，也有其他算法。

比如有网友反应，按照单个Token价格这个维度来计算，情况又是如何呢？

没关系，还有更专业的分析师会出手。

不过根据他的计算，每100万Tokens的花费，Groq性价比是要高一些。

除此之外，还有一些其他的讨论，像是否支持加速任何Transformer？

Groq在线答疑

由于大家过于关注，Groq忍不住亲自下场解答。

主要有以下几点：

另外还在持续地在线答疑中……

所以Groq是否能真的撼动住英伟达的地位，估计还得再等一等。

不过昨天英伟达股价倒是异动了一波……

参考链接：[1]

版权所有，未经授权不得以任何形式转载及使用，违者必究。

大模型推理芯片大模型 gpu 英伟达

声明：本文来自用户分享和网络收集，仅供学习与参考，测试请备份。

相关文章

运行LIama2得8400万元！最快AI推理芯片成本推算引热议 (运行linux需要什么配置)

科技前沿

运行LIama2得8400万元！最快AI推理芯片成本推算引热议 (运行linux需要什么配置)

2025-01-09 474次阅读

神器让大模型狂掉3 十亿参数一键瘦身！模型减重 (神器mod)

科技前沿

神器让大模型狂掉3 十亿参数一键瘦身！模型减重 (神器mod)

2025-01-09 783次阅读

英伟达首席科学家 5nm实验芯片用INT4达到INT8的精度每瓦运算速度可达H100的十倍 (英伟达首席科学家)

科技前沿

英伟达首席科学家 5nm实验芯片用INT4达到INT8的精度每瓦运算速度可达H100的十倍 (英伟达首席科学家)

2025-01-09 427次阅读

高通第四财季营收同比下降17.2% 手机基带芯片收入下降34% (高通第一财季收入增长62%)

科技前沿

高通第四财季营收同比下降17.2% 手机基带芯片收入下降34% (高通第一财季收入增长62%)

2025-01-09 360次阅读

新Mac搭载自研CPU！这届苹果开发者大会料足槽点密苹果新版iOS疯狂致敬安卓和微信 (新mac配置)

科技前沿

新Mac搭载自研CPU！这届苹果开发者大会料足槽点密苹果新版iOS疯狂致敬安卓和微信 (新mac配置)

2025-01-09 142次阅读

不愧是胶水操作系统我们用Windows官方跑了跑Linux GUI应用程序 (胶水小视频)

科技前沿

不愧是胶水操作系统我们用Windows官方跑了跑Linux GUI应用程序 (胶水小视频)

2025-01-09 443次阅读

神器让大模型狂掉3 十亿参数一键瘦身！模型减重 (神器mod)

上一篇文章

神器让大模型狂掉3 十亿参数一键瘦身！模型减重 (神器mod)

2025-01-09 783次阅读

下一篇文章

没有了！