0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌云(Google Cloud)利用AI将照片数字化

DPVg_AI_era 来源:未知 作者:李倩 2018-11-12 10:34 次阅读

珍贵的纸质老照片该如何保存?《纽约时报》与谷歌云合作,利用AI将19世纪以来的500-700万张历史照片数字化。谷歌云的AI技术不仅可以将照片数字化,还能扫描照片上的笔记,分类它们包含的位置、日期等语义信息

纸质老照片记录下了当时的珍贵时刻,其中的历史意义也更为重要,但纸质极容易损坏,人类该怎么保存它们,让它们恒久远永流传?

谷歌云(Google Cloud)利用AI将照片数字化。

在《纽约时报》位于美国时代广场办公室附近的地下室中存放了大约500万张到700万张的旧照片,存在这些照片的地方名为资料档案室。

《纽约时报》不仅存放了这些照片,也存储了有关它们是何时发布及其发布原因的相关信息。现在,该报正在与谷歌云合作,准备将其庞大的藏品数字化。

谷歌云官方发布博客称,它将与纽约时报合作,将庞大的照片集数字化,利用谷歌云中的工具帮助《纽约时报》安全地存储照片,提供更好的界面来查找照片,甚至可以通过照片背后的数字来获得更多照片内蕴含的信息。

纸质实物易腐烂,通过AI保护珍贵的视觉遗产

“资料档案室保存的照片可以追溯到19世纪末期,其中许多内容具有巨大的历史价值——很多照片是世界上其他地方都没有的。 2015年,一个破损的管道淹没了档案馆 ,使整个馆藏面临风险。 幸运的是,当时只有轻微的损害,但这一事件引发了人们反思:这些最宝贵的实物资产该如何安全存储?

《纽约时报》的资料档案室

“资料档案室是一个易腐文件的宝库,不仅是《纽约时报》的历史,而且是近一个多世纪以来影响我们现代社会的全球事件的无价编年史。”《纽约时报》新任首席技术官Nick Rockwell说。

不仅照片的图像包含有价值的信息。 在许多情况下,照片的背面包括拍摄照片的时间和地点。Rockwell补充说:“照片部门和商业方面的工作人员多年来一直在探索将这些照片数字化的可能途径。 但就像去年一样,数字化存档的想法似乎仍然遥不可及。”

《纽约时报》的老照片:1984年,苹果创始人史蒂夫·乔布斯

为了保护这个无价的历史,并让《纽约时报》能够通过更多的视觉叙事和历史背景来增强其报道, 《纽约时报》正在对其档案进行数字化,使用谷歌云来存储资料档案室内所有图像的高分辨率扫描。

谷歌云是可用于存储对象的系统,它为纽约时报等客户提供自动生命周期管理,不同区域的存储以及易于使用的管理界面和API

AI工作原理:Google Cloud中的技术可以处理和识别照片中的大量信息

仅仅存储高分辨率图像不足以创建照片管理者可以轻松使用的系统。

有效的资产管理系统必须允许用户轻松浏览和搜索照片。《纽约时报》建立了一个存储和处理照片的处理系统,并将使用Google Cloud中的技术处理和识别图像中可以找到的文本、手写内容和其他细节。

以下它的工作原理:

将图像提取到云存储后, 《纽约时报》使用Cloud Pub / Sub启动处理传输途径以完成多项任务。 通过在Google Kubernetes Engine (GKE)上运行的服务调整图像大小,图像的元数据存储在运行在谷歌完全托管数据库产品Cloud SQL里的PostgreSQL数据库中。

Cloud Pub / Sub帮助《纽约时报》创建其处理流程,而无需构建复杂的API或业务流程系统。它是一个完全托管的解决方案,因此没有时间维护底层基础架构。

谷歌云官方发布与《纽约时报》合作将照片数字化的宣传片,讲述了AI工作原理

为了调整图像大小和修改图像元数据, 《纽约时报》使用开源命令行程序“ImageMagick ”和“ ExifTool ”。 他们将ImageMagick和exiftool添加到Docker镜像中,以便以最小的管理工作量、一种水平可扩展的方式在GKE上运行它们。 添加更多容量来处理更多图像并不重要,当不需要服务时,《纽约时报》可以停止或启动其Kubernetes集群。 这些图片还存储在云存储的多区域位置创建的存储桶中,以便在多个位置提供可用性。

存档的最后一部分是在图像及其元数据在“纽约时报”管理系统中移动时跟踪它们。Cloud SQL是一个很好的选择。对于开发人员,Cloud SQL提供了一个标准的PostgreSQL实例:作为完全托管的服务,无需安装新版本、应用安全补丁或设置复杂配置。 Cloud SQL为开发者们提供了一种使用标准SQL解决方案的简单方法。

不只是存储图像,机器学习可以获取照片上的很多信息

存储图像只是这个故事的一部分。

为了使像《纽约时报》资料档案室的图片更加便于使用,利用额外的GCP功能是有益的。 在《纽约时报》的案例中,扫描照片的更大挑战是添加有关老照片的内容数据。 Cloud Vision API可以帮助填补这一空白。

让我们来看看《纽约时报》旧宾州车站的这张照片。 来看下这张照片的正面和背面。

这是一张漂亮的黑白照片,但没有额外的背景,从照片的正面看不清楚它在讲述什么。 照片背面包含大量有用信息,Cloud Vision API可以帮助我们处理、存储和阅读它的信息。 当谷歌将图像的背面提交给API(无需额外处理)时,我们可以看到Cloud Vision API检测到以下文本(译者注:文本逻辑并非完全清晰,主要是照片上的碎片化内容):

1985年11月27日

1992年7月28日

时钟悬挂在1942年宾夕法尼亚车站主要大厅的入口上方,右侧是车站外部,然后于1963年拆除。

在纽约出版

存储于1972年4月30日

《纽约时报》那时赋予这张照片的意义:1942年拥挤的宾州车站,这个时代“只有勇敢的飞行 - 到华盛顿,迈阿密和各种各样的车站。”

背面信息:

宾州车站的好日子/怀旧之旅

(OCT 3194

RAPR 20072

摄影:纽时时报工作人员,1942年,纽约人大学城的旧宾夕法尼亚电视台。该人士在现在的Postellgesikha将军那里建立了一个发电台

Pub NYT Sun 5/2/93 Metro

THURSDAY EARLY RUN o cos x ET RESORT

EB 11 1988

RECEIVED DEC 25 1942 + ART DEPT. FILES

The New York Times Business at rail terminals is reflected in the hotels;

OUTWARD BOUND FOR THE CHRISTMAS HOLIDAYS The scene in Pennsylvania Station yesterday afternoor afternoothe New York Times (Greenhaus)

这是我们的Cloud Vision API的实际输出,无需对图像进行额外的预处理。 当然,数字文本转录并不完美,但它比处理数百万张图像的替代品更快,更具节省成本。

谷歌云:将过去带向未来,使所有信息都变得可用

这只是个开始。 类似于《纽约时报》的公司可以使用Vision API来识别对象、地点和图像。 例如,如果我们通过带有徽标检测功能的Cloud Vision API传递上面的黑白照片,我们就可以看到宾州车站被识别出来了。

谷歌云的自然语言API可用于向已识别的文本添加其他语义信息。 例如,如果我们通过API,通过文本“纽约时报的方式 - 1942年拥挤的宾州车站,一个只有勇敢飞行的时代 - 华盛顿,迈阿密和各种各样的车站。”正确地将“宾州车站”,“华盛顿”和“迈阿密”识别为位置,并将整个句子分类为“旅行”类别和子类别“公共汽车和铁路”。

谷歌云在博客中声称,帮助《纽约时报》改造其照片档案完全符合谷歌的使命,即组织世界范围内的信息并使其普遍可用和有用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6142

    浏览量

    105102
  • AI
    AI
    +关注

    关注

    87

    文章

    30146

    浏览量

    268418
  • 数字化
    +关注

    关注

    8

    文章

    8610

    浏览量

    61640

原文标题:留住老照片,谷歌用AI帮纽约时报讲了500万个故事

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    花旗集团携手谷歌,加速数字化转型

    数字化转型步伐。 此次迁移不仅标志着花旗集团在计算领域迈出了坚实的一步,也体现了其对谷歌强大技术实力和广泛服务生态的高度认可。花旗集团
    的头像 发表于 10-29 14:59 335次阅读

    计算对企业数字化转型的影响

    计算对企业数字化转型的影响是多方面的,以下是对其影响的分析: 一、降低IT成本,提高资源利用效率 计算使企业能够根据实际需求灵活调整计算资源,实现按需分配和使用。传统的IT基础设施
    的头像 发表于 10-24 09:15 191次阅读

    霍尼韦尔携手谷歌,在工业领域引入生成式AI Gemini

    10月21日新闻,霍尼韦尔(Honeywell)携手谷歌Google Cloud)达成合作,旨在生成式人工智能Gemini引入工业领域
    的头像 发表于 10-23 14:20 246次阅读

    高通与谷歌达成多年技术合作,共推汽车行业数字化转型

    北京时间10月23日,高通技术公司宣布与谷歌达成一项为期多年的技术合作,旨在加速c行业的数字化转型。   基于双方长期的合作关系,高通和谷歌共同
    的头像 发表于 10-23 11:53 997次阅读

    高通与谷歌携手推动汽车行业数字化转型

    近日,高通技术公司与谷歌宣布了一项长期技术合作计划,共同致力于加速汽车行业的数字化变革。双方依托骁龙数字底盘、安卓汽车操作系统(AAOS)及谷歌
    的头像 发表于 10-23 10:51 307次阅读

    高速数字化仪的技术原理和应用场景

    数字化仪处理的信号精度就越高。在采样过程中,高速数字化模拟信号的连续时间信号转换为离散时间信号,使其可以进行数字信号处理。 量化:量化是
    发表于 10-21 14:34

    NetApp与Google Cloud深化合作,强化分布式存储

    智能数据基础设施领导者NetApp®宣布,其与Google Cloud的战略合作再升级。此次合作中,NetApp统一数据存储和智能服务融入Google Distributed
    的头像 发表于 10-11 17:21 449次阅读

    Persistent Systems携手谷歌,共推全球企业数字化转型

    在全球数字化转型的浪潮下,企业对于高效、安全、创新的解决方案需求日益迫切。为满足这一市场需求,全球数字工程和企业现代领域的佼佼者Persistent Systems近日宣布与谷歌
    的头像 发表于 06-12 15:32 412次阅读

    甲骨文与谷歌携手,共创技术新篇章

    数字化浪潮的推动下,计算已成为企业转型升级的必经之路。近日,两大科技巨头——甲骨文(Oracle)和谷歌Google
    的头像 发表于 06-12 15:10 472次阅读

    谷歌与Workday扩大合作关系

    近日,谷歌Google Cloud)宣布与美国知名云端财务与人力资本管理软件公司Workday深化合作。此次合作旨在通过创新技术,提升企业管理效率,助力客户实现卓越业绩。
    的头像 发表于 06-05 14:19 514次阅读

    荣耀宣布推出搭载谷歌 Gemini AI的智能手机

    CNBC报道称,荣耀方面透露,新品融合谷歌GeminiAI和Imagen 2图像生成工具等生成式AI技术,同时由Google Cloud
    的头像 发表于 05-27 17:46 794次阅读

    Google Cloud推出基于Arm Neoverse V2定制Google Axion处理器

    Arm Neoverse 平台已成为服务提供商优化其从芯片到软件全栈的心仪之选。近日,Google Cloud 推出了基于 Arm Neoverse V2 打造的定制 Google
    的头像 发表于 04-16 14:30 595次阅读

    谷歌发布Axion新款数据中心AI芯片,性能超越x86及云端

    谷歌预计通过Google Cloud提供Axion AI芯片给客户。谷歌强调这款基于ARM的C
    的头像 发表于 04-10 16:32 845次阅读

    Google Cloud 推出 TPU v5p 和 AI Hypercomputer: 支持下一代 AI 工作负载

    以下文章来源于谷歌服务,作者 Google Cloud Amin Vahdat ML、系统与 Cloud
    的头像 发表于 12-13 16:05 547次阅读
    <b class='flag-5'>Google</b> <b class='flag-5'>Cloud</b> 推出 TPU v5p 和 <b class='flag-5'>AI</b> Hypercomputer: 支持下一代 <b class='flag-5'>AI</b> 工作负载

    Google Cloud 线上课堂 | Google Cloud 迁移最佳实践

    以下文章来源于谷歌服务,作者 Google Cloud 立即预约 长按识别/扫描 右方二维码 预约观看直播 各行各业的组织都积极业务迁移
    的头像 发表于 11-28 17:45 478次阅读