对于视障人士而言,现在许多软件能够实现文字的自动朗读,使得他们阅读网页内容变得更加便捷。
然而,现有的朗读软件只能识别文本内容,无法识别图片和多媒体内容,因此视障人士要了解图片内容仍然存在困难。
作为全球用户数量最多的浏览器之一,谷歌浏览器的研发团队正利用机器学习技术来识别图像内容并提供相应的描述。
这样一来,当朗读软件朗读网页中的图片时,它会读出谷歌为这些图片提供的描述,从而帮助视障人士更好地理解图片内容。
为了实现这一功能,谷歌利用其强大的计算能力搭建基础设施,并在其基础设施中部署了机器学习技术来识别图片内容。
据谷歌称,在过去的测试中,该团队已经成功识别并为数千万张图片提供了自动描述。
值得注意的是,识别图片内容并为其提供描述需要大量的计算资源,因此谷歌并不会立即对抓取到的图片进行识别。
相反,当视障用户启用辅助功能访问网页时,谷歌浏览器会自动为这些图片添加描述并保存到数据库中。
如果图片的数据已经被保存在谷歌的云端数据库中,那么当其他用户需要朗读页面时,浏览器会从数据库中检索相应的图片描述。
除了简单的图像识别外,谷歌的机器学习技术还会结合网页内容、图片及其相关标签等信息,为图片提供更为精准的描述。
如果机器学习系统认为无法准确描述图片,则会选择不提供描述,以避免误导用户。
遗憾的是,此服务需要连接谷歌服务器才能使用,而且当前返回的图片描述仅为英文,因此国内用户暂时还无法享受这一便利。
希望未来谷歌能够提供更多本地化服务,以便更多用户受益于这一创新技术。