2024年,科技界迎来历史性时刻。国外的OpenAI推出了视频生成大模型Sora,国内快手也推出了自研的视频生成大模型“可灵”。这一创新标志着AI技术从文本生成迈向视频生成的新阶段,将“视频生成”从实验室概念转变为能够模拟现实世界的强大工具,预示着AIGC领域将加速迎来红利期。
在数字化浪潮的推动下,信息传递与接收渠道变得前所未有的多样化。视频凭借其多维信息展现能力、丰富的画面表现以及生动的动态特性,已成为信息传播领域的核心力量。与单纯的文字描述和静态图像相比,视频能够无缝集成文本叙述、直观图像、生动声音及精细的视觉效果,为观众带来深度体验与沉浸享受,极大地增强了信息传递的效果与感染力。
中国庞大的互联网用户群体和丰富的短视频内容资源,为视频生成大模型的训练和发展提供了海量且高质量的基础数据支持。已经涌现出如快手“可灵”、商汤“Vimi”、智谱“清影”、爱诗科技“Pixverse”等诸多产品。作为短视频直播平台,快手“可灵”不仅在生成速度、视频时长、连贯性、美观性、逼真性等硬指标上表现不俗,还能精准理解和创造性执行复杂指令,使得AI生成的视频内容接近人类创作水平。
Sora和“可灵”等大模型产品的发布彰显了AI在视频生成领域的巨大潜力,并激发了人们对其广泛应用场景的想象。在教育领域,视频生成技术让虚拟实验、历史场景再现成为可能,丰富了教育资源的多样性和个性化;在游戏开发方面,AI生成的游戏场景、角色和剧情降低了开发门槛,提升了游戏可玩性和多样性;在医疗领域,视频生成技术辅助模拟手术、展示病灶,为医生提供直观的诊断依据;在文娱产业,AI不仅辅助编剧,还能自动生成场景、角色、特效,显著缩短制作周期、降低成本。目前,多位导演正在依托“可灵”大模型制作完全由AIGC生成的电影短片,大模型将展现“电影级”能力。
短短半年间,视频生成大模型迅速完成了从技术创新到探索落地,再到广泛商业应用的转变。在电商领域,视频大模型实现了实质性的“赋能”,商家可以利用AI快速生成产品展示视频,以更直观、生动的方式向消费者展示商品的特点和优势,提升了购物体验和销售转化。以快手为例,基于“快意”大模型构建的视频脚本生成、直播实时脚本生成、广告线索客服等功能,结合数字人技术,帮助广告主低成本生成高品质内容,提升了线索转化效率。快手AIGC月活跃客户数从年初至今增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍,AIGC营销素材在6月单日消耗峰值突破2000万。“可灵”AI已经累计服务超过260万用户,生成5300万张图片、2700万个视频,显示了大模型在商业场景中的巨大潜力。
我国高度重视生成式人工智能的发展,《中共中央关于进一步全面深化改革、推进中国式现代化的决定》明确提出要“完善生成式人工智能发展和管理机制”。各级政府也在积极推进相关政策的落地实施,围绕生成式人工智能的算法、算力、数据、场景、人才等方面不断部署,多渠道、多手段支持生成式人工智能的发展。然而,视频生成大模型的广泛应用也带来了一系列挑战和问题,如创作范式的变革、“文生视频”“图生视频”的创作方式完全不同于原有的电影视频创作,需要尽快研究相关教程,帮助大模型更好地赋能创作。此外,如何确保生成内容的真实性、避免虚假信息的传播,如何保护知识产权等问题也需要共同面对和解决。国家互联网信息办公室已发布《人工智能生成合成内容标识办法(征求意见稿)》相关规定,在政策的引导下,视频生成行业将会更加规范、健康地发展,为社会进步和繁荣贡献更大的力量。
大模型迈入规模化应用期,视频生成红利加速显现,这不仅是AI技术的又一次飞跃,更为我们开启了一个充满无限可能的新世界。相信在各方共同努力下,以视频生成为主导的AIGC将加速落地,赋能各行各业,推动社会向更加美好的未来迈进。
转载请注明来自共享纸巾,本文标题:《官方发布意见稿 AI生成内容需“亮明真身” 视频生成迎红利期》