音频

网站随机

如何在 Linux 上使用 FFmpeg 命令进行音频和视频处理

FFmpeg 是一个著名的命令行媒体处理工具。下面介绍如何在 Linux 上安装和使用它来修改音频和视频文件。几乎所有处理视频的人都可能听说过 FFmpeg。对于不熟悉的人来说，…

2493
2024年1月17日
000
网站随机

基于RK3399OpenHarmony富设备软件音频解码方案

一、音频编解码原理数字音频是由 PCM(Pulse Code Modulation，脉冲编码调制)技术将模拟信号，主要经过抽样、量化、编码三个处理过程产生的，其中的编码就是按照一…

188导航
2024年1月16日
000
人工智能

图片+音频秒变视频！西交大开源SadTalker：头、唇运动超自然，中英双语全能，还会唱歌

随着数字人概念的火爆、生成技术的不断发展，让照片里的人物跟随音频的输入动起来也不再是难题。不过目前「通过人脸图像和一段语音音频来生成会说话的人物头像视频」仍然存在诸多问题，比如头…

tw
2023年7月17日
000
人工智能

解密实时通话中基于 AI 的一些语音增强技术

背景介绍实时音视频通信 RTC 在成为人们生活和工作中不可或缺的基础设施后，其中所涉及的各类技术也在不断演进以应对处理复杂多场景问题，比如音频场景中，如何在多设备、多人、多噪音场…

FF莫属。
2023年7月17日
000
人工智能

图片+音频秒变视频！西交大开源SadTalker：头、唇运动超自然，中英双语全能，还会唱歌

随着数字人概念的火爆、生成技术的不断发展，让照片里的人物跟随音频的输入动起来也不再是难题。不过目前「通过人脸图像和一段语音音频来生成会说话的人物头像视频」仍然存在诸多问题，比如头…

小盆友
2023年7月17日
000
人工智能

基于扩散模型的音频驱动说话人生成，云从&上交数字人研究入选ICASSP 2023

近日，国际语音及信号处理领域顶级会议 ICASSP2023 在希腊成功举办。大会邀请了全球范围内各大研究机构、专家学者以及等谷歌、苹果华为、Meta AI、等知名企业近 4000 …

0008
2023年7月17日
000
人工智能

3秒复制任何人的嗓音！微软音频版DALL·E细思极恐，连环境背景音也能模仿

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。只需3秒钟，一个根本没听过你说话的AI，就能完美模仿出你的声音。例如这是你的一小句聊天语音：说话人…

浪博❗
2023年7月16日
000
人工智能

微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话

1 月 10 日消息，微软最近发布了一款名为 VALL-E 的人工智能工具，只需 3 秒音频即可模仿人说话。该工具经过 60000 小时英语语音数据的训练，并使用特定语音的 3 …

天道愁勤
2023年7月16日
000
人工智能

这段音频火爆外网！文字、图片一键生成逼真音效，音频界AIGC来了

近期 AIGC 如同上了热搜一般，火热程度居高不下，当然除了名头格外响亮，突破也是绝对斐然：输入自然语言就可自动生成图像、视频甚至是 3D 模型，你说意不意外？但在音频音效的领域…

德人心得天下
2023年7月16日
000
人工智能

从视频到音频：使用VIT进行音频分类

就机器学习而言，音频本身是一个有广泛应用的完整的领域，包括语音识别、音乐分类和声音事件检测等等。传统上音频分类一直使用谱图分析和隐马尔可夫模型等方法，这些方法已被证明是有效的，但也…

钱来风
2023年7月16日
000
人工智能

只需3秒就能偷走你的声音！微软发布语音合成模型VALL-E：网友惊呼「电话诈骗」门槛又拉低了

让ChatGPT帮你写剧本，Stable Diffusion生成插图，做视频就差个配音演员了？它来了！最近来自微软的研究人员发布了一个全新的文本到语音（text-to-speec…

鱼眼图库
2023年7月16日
000
人工智能

谷歌AI歌手震撼来袭！AudioLM简单听几秒，便能谱曲写歌

图像生成模型卷起来了！视频生成模型卷起来了！下一个，便是音频生成模型。近日，谷歌研究团队推出了一种语音生成的AI模型——AudioLM。只需几秒音频提示，它不仅可以生成高质量…

⁡
2023年7月15日
000

1 / 2
1
2
下一页