一、重点发现
视频生成模型的发展速度令人瞩目,在人工智能领域的竞争已经达到了白热化阶段。各大厂商之间的激烈角逐不仅推动了技术的快速进步,也为整个行业营造了一个更加公正和开放的竞争环境。尽管如此,从年初令人瞩目的 Sora 到近期的可灵、Luma、Gen-3Alpha 等模型,它们所生成的视频作品均未能突破声音的局限。然而,GoogleDeepMind 推出的 V2A 技术,为这一问题提供了解决方案。从技术应用来看,V2A 技术与 Veo 等视频生成模型的结合,将能够创造出既具有戏剧性配乐、逼真音效,又能与视频中的角色、风格完美融合的对话镜头。这一创新标志着 AI 视频即将告别无声时代,迎来一个充满活力、充满创新的有声世界。
二、具体内容
大模型持续更新
多模态领域
开源领域
科研领域
应用探索
新产品新应用/功能新动态
智能体
报告推荐
Sora 来袭,国内发展文生视频模型的土壤如何?各公司用脚投票开闭源路线的当下,开源在大模型市场进程中的价值正在被重新定义吗?人型机器人重回视野,大模型是否助力其刷新能力上限?Devin 和智能编码助手是同一条赛道上的不同节点?多家企业宣布 AllinAI,对市场意味着什么?答案尽在 InfoQ 研究中心发布的 《2024年第1季度大模型监测报告》 ,关注「AI 前线」公众号,回复「季度报告」免费下载,一睹为快吧~
报告预告
金融行业是否找到了 AGI 应用的最佳路径?取得了哪些具体应用成果?又存在哪些难以逾越的挑战与桎梏?金融机构一定要做 AGI 建设吗?如何考量金融 AGI 应用产品的效果?欢迎大家持续关注 InfoQ 研究中心即将发布的 《AGI 在金融领域的应用实践洞察》 。
活动推荐
InfoQ将于8月18日至19日在上海举办AICon全球人工智能开发与应用大会,汇聚顶尖企业专家,深入端侧 AI、大模型训练、安全实践、RAG 应用、多模态创新等前沿话题。现在大会已开始正式报名,6月30日前可以享受8折优惠,单张门票节省960元(原价4800元),详情可联系票务经理13269078023咨询。
原文链接: