快手、字节“AI军备竞赛”:一场没有赢家的技术泡沫秀?
2024年初,OpenAI公布的Sora AI视频生成模型,震撼了国产大模型行业。随后国产厂商集体发力视频大模型,快手发布视频生成大模型可灵,字节跳动发布豆包视频生成模型,正式打响了国内AI视频生成领域第一枪。
众多企业匆忙入局,只为在这片新兴市场中抢占先机,却往往忽视了技术成熟度与应用规范的打磨。
以社交平台上泛滥的 AI 伪造视频为例,全红婵家人被恶意仿冒博流量卖货,明星们也纷纷中招,刘晓庆、张馨予等均曾反馈有人在视频号上通过AI生成视频假冒她。这些伪造视频不仅严重侵犯他人权益,更在商业利益的驱使下,充斥着虚假营销,让不明真相的消费者屡屡受骗。
AI视频生成领域正处于应用爆发前夜,快手、字节等业内玩家试图通过技术迭代推动产品破圈,却也陷入了无序竞争困境。
AI视频赛道尚未成熟
当前,AI视频生成赛道看似热闹非凡,实则整体仍处于不成熟的初级阶段。
尽管各大厂商拼命投入资源,力求在模型性能指标上不断突破,从生成时长的延长到画面质量的优化,看似让AI视频生成赛道加速迈进“技术突破期”,但AI视频技术应用仍有不完善之处。
以快手和字节跳动为例,快手于近期发布了可灵2.0视频生成模型及可图2.0图像生成模型,自2024年6月6日首次上线开放测试以来,可灵AI已快速迭代二十余次,其模型在动态质量、语义响应、画面美学等维度表现出色。
字节跳动的Seed团队也推出了Seedream 3.0,据第三方榜单Artificial Analysis显示,Seedream 3.0综合性能追平文生图SOTA模型GPT-4o,进入全球第一梯队。
然而,这背后也暴露出AI视频生成领域存在的诸多问题。
一方面,部分企业为了在竞争中脱颖而出,过度追求技术迭代速度,而忽视了产品应用的实际情况,使得AI视频生成技术在实际应用中漏洞百出。
例如,当用户输入“敦煌飞天”时,AI可能生成面部扭曲的虚拟形象;要求制作科普视频时,常出现违背物理规律的悬浮物体。据MIT媒体实验室测试,当前主流AI视频模型在复杂叙事连贯性上的准确率不足63%,这严重制约了AI视频生成技术在商业应用中的边界。
另一方面,随着技术的快速发展,版权问题逐渐凸显,成为AI视频生成领域的一大“雷区”。
当AI融合多个版权素材生成新内容时,现有的“合理使用”原则已难以适用,这让企业在版权问题上面临着巨大的法律风险。从Getty Images起诉Stability AI使用其版权图片训练模型,到日本漫画家协会禁止使用AI生成分镜,再到全球首个AI视频版权案判决金额高达2.3亿美元,版权问题仍未得到合理解决。
更值得关注的是,当前的AI视频生成技术虽然在画面质量、生成速度等方面取得了显著进步,但在视频内容的逻辑连贯性、情感表达深度以及对复杂场景的理解等方面仍存在较大不足,无法完全满足市场对高质量、多样化视频内容的需求。
由此可见,快手想要让可灵AI成为营收规模全球第一的视频生成AI应用,这条路任重道远。
字节与快手“抢滩”
当前 AI 视频生成领域风起云涌,字节跳动与快手作为行业内的两大巨头,正在 AI 视频赛道上奋力抢滩,二者策略各有侧重,呈现出别样的竞争态势。
快手主张商业化先行,打造多元变现模式,已在 AI 视频生成领域取得了令人瞩目的成绩。
在技术方面,快手可灵 AI 展现出了强大的实力,为其商业化拓展提供了坚实的技术支撑。据全球知名 AI 基准测试机构 Artificial Analysis 发布的榜单显示,快手可灵 1.6pro(高品质模式)以 1000 分的 Arena ELO 基准测试评分登陆图生视频赛道榜首,超越了 Google Veo 2、Pika Art 等强劲对手。
在商业化方面,快手无疑走在了前列。可灵 AI 采取了“C 端订阅 + B 端 API 服务 + 定制化场景解决方案”的多元变现模式,既满足了个人用户的创意需求,又为企业客户提供了强大的视频生成工具。
据了解,可灵视频大模型全球用户规模突破 2200 万,吸引了来自世界各地的超 1.5 万开发者和企业客户,将可灵的 API 应用于不同的行业场景中。截至 2025 年 2 月底,可灵 AI 的累计营业收入超 1 亿元。
字节跳动则展现了不同的野心和策略,其对 AI 视频生成的布局更侧重于对 AGI(通用人工智能)的探索。
年初字节跳动豆包大模型团队在内部组建了代号为“Seed Edge”的 AGI 长期研究团队,鼓励项目成员探索更长周期、不确定的和大胆的 AGI 研究课题,目标是探索 AGI 的新方法,并鼓励跨模态、跨团队合作。
字节跳动近期发布的 Seaweed-7B 模型,以其音画一体生成、长镜头生成、实时生成等多项前沿技术。该模型能够在短短 25 秒内生成高质量的视频内容,且推理速度比同类模型提升 62 倍,其性能与 Wan 2.1-14B 相当,在文本转视频的任务中,Elo 评分仅次于排名第一的模型 Veo 2。
相比于快手的商业化先行,字节跳动更注重在技术层面的深耕和突破,试图通过解决 AGI 这一终极难题,来实现其在 AI 视频生成领域的长远发展和全面领先。快手需要在保持商业化优势的基础上,进一步加大技术研发投入,提升 AI 视频生成的质量和效率,以免被字节跳动抢了“风头”。
更大的目标和挑战
AI浪潮汹涌,快手正试图借助 AI 之力重塑自身商业版图,AI视频生成赛道只是其宏伟蓝图中的一部分。
从快手的营收数据来看,2024 年总营收同比增长 11.8% 至 1269 亿元,经调整净利润大幅增长 72.5% 达 177 亿元,线上营销服务和其他服务收入同比增长率均超 20%,亮眼的成绩背后,AI 成为了关键的增长引擎。
快手设定的AI目标很宏大,其面临的挑战也全方位且极为严峻。
一方面,快手计划持续强化 AI 技术对原有商业生态的改造,为线上营销服务和电商业务开拓新的增长空间。
理论上 AI 可以精准分析用户需求,为商家提供更有效的营销方案,但实际操作中却困难重重。在内容生产环节,AI 更多只能起到辅助作用,无法从根本上解决内容质量参差不齐的问题;在经营成本方面,AI 技术的引入可能会在一定程度上降低某些环节的成本,但同时也带来了新的成本,如技术使用成本、数据安全维护成本等。
另一方面,快手全力升级以可灵为代表的 AI 商业化变现模式,试图将可灵 AI 打造成为全球 1200 亿美元视频创作市场的 AI 基础设施,进而实现从“中国第二大短视频平台”到“AI 视频生态领军者”的华丽转身。
这无疑是一场豪赌。构建基础设施意味着要具备强大的技术通用性、稳定性以及广泛的市场认可度,快手需要投入海量的资源用于技术研发、生态建设与市场推广。而当前行业内,技术标准尚未统一,市场格局分散,快手在推动自身技术成为行业标准的过程中,必然会遭遇来自各方的阻力。
机遇与挑战并存,如果快手不能在技术研发、商业策略以及行业责任担当等方面做出深刻调整与优化,那么其所谓的“AI 视频生态领军者”的愿景,很可能只是镜花水月,最终在激烈的市场竞争与行业变革中被无情淘汰。
原文标题 : 快手、字节“AI军备竞赛”:一场没有赢家的技术泡沫秀?

最新活动更多
-
3月27日立即报名>> 【工程师系列】汽车电子技术在线大会
-
4月30日立即下载>> 【村田汽车】汽车E/E架构革新中,新智能座舱挑战的解决方案
-
5月15-17日立即预约>> 【线下巡回】2025年STM32峰会
-
即日-5.15立即报名>>> 【在线会议】安森美Hyperlux™ ID系列引领iToF技术革新
-
5月15日立即下载>> 【白皮书】精确和高效地表征3000V/20A功率器件应用指南
-
5月16日立即参评 >> 【评选启动】维科杯·OFweek 2025(第十届)人工智能行业年度评选
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论