首页资讯正文

可灵AI全系模型上线“视频音效”功能可同步生成高质量立体声音效

体育正文 2025-07-03 07:20:32 45 0

可灵AI全系模型上线“视频音效”功能可同步生成高质量立体声音效

可灵AI全系模型上线“视频音效”功能可同步生成高质量立体声音效

6月27日，可灵AI宣布全系列视频模型(móxíng)上线(shàngxiàn)“视频音效”功能，用户在使用可灵AI进行视频创作时，不仅能获得高质量的(de)视频画面，更能体验到与视频精准匹配、富有空间感的立体声音效，真正实现“所见即所听”的沉浸式体验。目前，该功能已(yǐ)无缝集成至文生视频、图生视频、多模态编辑等多种(duōzhǒng)创作模式中，并限时免费开放。与此同时，平台原有(yuányǒu)的“音效生成(shēngchéng)”也进一步升级，新增“视频生音效”功能。用户现在不仅可以通过文本生成音效，更可以直接上传本地视频，或选用在可灵平台创作的历史(lìshǐ)视频，一键为无声的画面匹配(pǐpèi)上语义契合、节奏同步的音效，自动适配动作、环境、氛围等多种场景，极大地提升了视频内容的表现力(biǎoxiànlì)和沉浸感，有效降低了创作者在音频后期制作上的时间与技术(jìshù)成本。从实际效果(xiàoguǒ)来看(láikàn)，可灵AI的音效功能在多个典型案例中展现了极高的音画(yīnhuà)同步精度和极佳的空间听感。例如，在生成“婴儿在活泼地笑”的视频片段中，模型不仅还原了婴儿清亮的笑声，甚至连婴儿笑容间隙短促的吸气(xīqì)声都完美捕捉，与(yǔ)画面中肉嘟嘟脸颊的起伏动作精准匹配，其富有(fùyǒu)空间感的立体声效果，让整个画面的温馨感与生命力扑面而来。在另一段山体滑坡导致巨石砸中汽车的视频中，系统自动生成了金属扭曲断裂声、石块飞溅与尘土扬起(yángqǐ)的细节音效(yīnxiào)，声音定位清晰、动态层次丰富(fēngfù)，提升了整体灾难场景的视觉冲击力与沉浸感。据悉，上述功能的实现，依托于可灵AI自主研发的多模态视频生(shēng)音效模型(móxíng)——Kling-Foley。Kling-Foley 支持基于视频内容与可选文本提示自动生成(shēngchéng)与视频画面语义相关、时间同步的高质量立体声音频(yīnpín)，涵盖音效、背景音乐等多种类型声音内容。它(tā)支持生成任意时长的音频内容，还具备立体声渲染的能力，支持空间定向(dìngxiàng)的声源建模和渲染。今年3月，可灵AI首次推出AI音效功能，用户可通过输入文本生成(shēngchéng)(shēngchéng)相应的环境音或(huò)动作音，并可进一步(jìnyíbù)结合平台生成的视频进行语义理解与自动匹配。随后，在可灵2.1模型中正式加入了视频音效功能，在生成视频的同时，系统也会自动生成与之匹配的音效，增强了整体(zhěngtǐ)视听体验。随着视频音效生成技术的成熟落地，将进一步释放(shìfàng)可灵AI在广告创意、影视、短视频、游戏等内容等领域的发展潜力。（本文(běnwén)来源：日照新闻网。本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成(gòuchéng)投资、消费建议。对文章事实有疑问，请与有关(yǒuguān)方核实或与本网联系。文章观点非本网观点，仅供读者参考。）

标签

仙贝林 45 0

0

相关推荐

取消回复欢迎你发表评论:

评论列表

暂时没有评论

暂无评论，快抢沙发吧~