谷歌要让电脑能读懂你的照片

  谷歌(微博)多名研究人员日前发博客透露,谷歌想要为复杂图片开发一种能够提供自动字幕的技术,其可精准描述图片中的内容,而且他们正接近实现这个目标。

  谷歌的机器学习系统可以“看到”照片,然后自动生成描述和相关说明。这套系统通过识别图片上不同对象以及它们之间的互相关系,对图片上的内容进行更深层次的解读,最后翻译成更为自然的描述。

  谷歌研究员奥利奥尔·温雅尔斯(Oriol Vinyals)、亚历山大·托舍夫(Alexander Toshev)、萨米·本吉奥(Samy Bengio)以及杜米特鲁·艾尔罕(Dumitru Erhan)等人写道:“这种系统最终可以帮助视障人士了解照片,在世界上移动连接速度很慢的部分地区提供替代文本,使用户更容易在谷歌上搜索图像。”

  谷歌团队的关键创新是,将计算机视觉系统(在图片中将对象分类)与自然语言程序模式结合起来,当这套系统看到图片后,可以直接生成语句描述它。

  谷歌研究人员承认,这套系统依然有许多工作需要改进。他们称:“我们将继续研发这套系统,期望它能够读取照片,并能生成足够好的自然语言描述。”(风帆)

作者:佚名
来源:腾讯科技

兰州宏点信息技术有限责任公司,简称宏点网络,品牌网站与互联网应用服务商,成立于2001年8月28日。宏点网络致力于为成长中的政企客户提供互联网应用开发和配套服务。我们从事甘肃兰州中小企业网站建设、网页设计,各级政府站群、各类学校站群、大中型国企站群项目的实施,微信小程序开发和微信公众号开发以及苹果iOS的APP开发和安卓Android的APP开发等业务。
历史
400-6808-205
全国24小时客服专线