百度推出能用AI转录音频的应用SwiftScribe

发布:2017-03-15 来源:一推响 作者:admin 分类:网络营销新闻

百度推出能用AI转录音频的应用SwiftScribe

  3月14日,百度推出了一款音频转录工具SwiftScribe,该工具可利用人工智能技术快速地将音频快转录成文字。对于速录员来说,利用SwiftScribe工具可大大提升工作效率。

  百度在近年一直在持续改善其新一代深度语音识别系统DeepSpeech2。DeepSpeech2系统由百度硅谷人工智能实验室(SVAIL)研发,并在去年被麻省理工科技评论评为2016年十大突破技术。

  “百度在语音技术领域不断进步,语音接口更为实用和有效,用户可以愈加便利地与身边的设备进行互动。百度的深度语音识别系统DeepSpeech2包含了一个非常庞大的神经网络,引入了数以百万计的转录语音。有时它在识别汉语语音片段方面,要比人为识别更加准确。”麻省理工科技评论写道。

  百度在去年也推出了应用DeepSpeech2的安卓输入法应用TalkType,让用户能够快速语音输入文字。国际科技巨头如微软、亚马逊、苹果以及谷歌同样在语音识别领域投入大量精力,但在长段语音识别转录上仍不及百度。

  SwiftScribe支持wav和mp3格式的音频文件进行转录,一段30秒左右的音频转录成文本时间大概为10秒,而一段1分钟左右的文件大致需要30秒的转录时间。SwiftScribe最大支持用户上传1小时长的音频文件,1小时的音频则需要20分钟左右的处理时间,百度的项目管理人武田说。

  目前SwiftScribe的功能还不是很完善,在转录成功后,用户还需自行对文本进行编辑。SwiftScribe转录出来的文本是不带标点符号的,用户需要自行断句、并对可能出现的错误进行更正、以及编辑英文单词大小写等。不过SwiftScribe同样提供变速阅读工具,让用户在校对编辑时可以调慢播放速度。