Aug X推出了Augie,一个由人工智能驱动的视频创作平台,集成了语音克隆功能,可以在不预定录音室的情况下阅读广告文案。
Aug X与ElevenLabs合作,让用户可以录制自己或别人的声音,并克隆它用于其他短视频。Augie平台主要针对营销人员和社交媒体团队,让人们可以快速地为视频添加旁白、照片、文字和音乐,而无需学习音频和视频编辑。
Aug X的创始人Jeremy Toeman说,公司想要增加语音克隆功能是因为意识到有些人不喜欢对着麦克风说话或录制旁白。
他说:“你会惊讶地发现,有多少人使用了我们的语音克隆功能后向我们表示感谢,因为他们不喜欢录制旁白。”
在向The Verge的演示中,Toeman说用户可以将脚本写入或上传到Augie,然后使用预先录制的声音(人们需要录制一段自己说任何话的声音片段)或从其库中选择一个。然后,这个声音就会以适合视频氛围的语气(严肃、热情、恐怖等)来阅读脚本。
用户还可以从一个照片库中选择——Aug X从Getty获得了照片的授权——或使用人工智能生成的图像来添加到视频中。
Toeman设想营销团队可以在不需要预定公司发言人在录音室的时间的情况下快速制作短视频。
Augie于 5 月份公开测试。目前,使用Augie的每个人都可以使用语音克隆功能。Toeman说,最终,它可能会限制非付费订阅者的视频长度和质量以及克隆声音的数量,因为与合作伙伴运行语音克隆服务器的费用很高。
语音克隆并不是新鲜事;三星甚至让人们使用人工智能声音来回应电话,现在像Aug X这样的公司将这项技术整合到更全面的服务中。在一首深度伪造的德雷克歌曲中,使用了一个由人工智能生成的说唱歌手声音后,它帮助重新点燃了对版权和非法使用别人形象的担忧。
Toeman说:“我们已经预先考虑了可能出错的地方,所以我们对谁可以使用预先录制的声音进行克隆非常谨慎。”
他补充说,与Augie库中的那些声音相比,录制的声音只能供个人账户使用。所以同一个组织中的另一个人必须在他们自己的Augie账户上重新录制他们发言人的声音才能克隆他们的演讲。用户不能上传录音,平台只接受用实时麦克风录制的声音。所以,把你前任的声音放在扬声器上,这样你就可以用一个奇怪地乐于助人的朋友假装打电话是不会在Augie上起作用的。
该公司还与其语音克隆合作伙伴ElevenLabs合作,以识别由人工智能生成的声音和视频。