使用 JavaScript 进行语音识别

2025-05-25

使用 JavaScript 进行语音识别

介绍

语音识别是指使计算机能够识别并响应人类语音中的声音的过程。它于1952年在贝尔实验室
首次推出,当时只能识别数字,无法识别单词。几年后,语音识别从最初的识别数字发展到识别文本、语法,甚至检测噪音。 这项技术最初是为了替代键盘打字而开发的,你只需对着电脑说话,你的文字就会出现在电脑屏幕上。

网络语音API

2012 年,Web Speech Api推出,旨在实现语音识别并在现代网络浏览器上将文本转换为语音。

注意:目前并非所有浏览器都支持语音识别,请点击此处查看兼容浏览器列表。

入门

我们需要做的第一件事是检查我们的浏览器是否兼容语音识别,我们可以使用下面的代码轻松实现这一点👇

下一步是创建一个新的语音识别对象并检查录音何时开始。

最后开始我们的语音识别并对输出进行一些处理。

代码解释:

  • recognition.onstart:这是当语音识别服务开始监听传入音频时运行的事件处理程序。
  • recognition.onresult:当语音识别服务返回结果时将运行的另一个事件处理程序。
  • recognition.start():此方法将启动语音识别服务并开始收听传入的音频,首次运行此代码将显示一个对话框,要求访问您的设备麦克风,如下所示。


    语音识别,允许麦克风访问对话框

  • transcript:这是语音识别服务停止后生成的文本输出,这也是我们目前为止编写的所有代码所需的全部内容。目前,我们只是将输出记录到控制台,您可以选择对其进行其他操作。

访问语音识别对象时可以使用更多属性、方法和事件处理程序,其中包括:

  • recognition.grammars:用于设置语音识别服务能够理解的语法。
  • recognition.continuous:布尔值,设置每次识别是否返回连续结果,还是仅返回单个结果。

单击此处获取支持的方法、属性和事件处理程序的完整列表。

说吧🗣

我最近开发了一个渐进式 Web 应用(利用语音识别技术)
,可以将语音转换为文本,并提供一个按钮,方便用户在各种社交媒体平台上即时分享。
当你需要发送长邮件或在社交媒体上发帖时,这个项目会非常方便。点击此处
查看项目实况,如果你觉得它很棒,请在GitHub上点个星(也欢迎贡献🤗)。

结论

+1 无障碍设施

过去几年,语音识别在无障碍领域发挥了巨大作用,尤其对视障人士、手臂受伤人士等群体而言。由于无法使用键盘打字,他们不得不默认使用语音来控制和浏览应用程序和网页。


项目构想

如果你像我一样对语音识别如此着迷,不妨构建一个完全自动化、语音控制的网页,而不是点击或滑动。例如,在首页,我只需输入“转到关于页面”,就能直接跳转到关于页面,听起来很酷吧?太棒了!我很想看看你的成果,你可以在推特上给我留言,我很乐意回答你的问题。


附言:我正在寻找新的开发朋友🤗,让我们在推特上联系。

感谢阅读👏

文章来源:https://dev.to/asaoluelijah/speech-recognition-with-javascript-4lh6
PREV
今天是你的生日,现在虚拟切蛋糕吧!
NEXT
styled-components 简介