“能够自由获取信息是我所受教育的重要组成部分——我知道我并不孤单,”陈说道,她支持互联网档案馆作为数字在线图书馆的角色。“互联网档案馆是一颗隐藏的宝石……它对人类、对信息自由、信息多样性以及获取真相至关重要……我们不仅在为图书馆而战,也在为人类而战。”
几位用户分享了他们的经历,讲述了互联网档案馆的资源如何帮助他们推进研究,核实政客的言论,并激发他们的创作灵感。馆藏内容有
助于改进语言的机器翻译。它保
存了国际电视新闻报道以及乌克 东帝汶电话号码收集 兰与俄罗斯战争期间社交媒体上的表情包。
大卫·麦克雷尼通过视频向芬斯顿大道300号礼堂的观众发表讲话时表示,科技正在改变着一切——有些是变得更糟,但很多是变得更好。“当科技让一切变得更好时,它将拓展人类有限的能力。它将在速度和范围上拓展这些能力的覆盖范围,”他说。“这关乎一种新发现的思想和时间自由,并将这种自由民主化,让每个人都能享有它。”
开放图书馆开发者 Drini Cami 解释了互联网档案馆如何利用人工智能来改善对其藏品的访问。
过去,书籍数字化时,扫描操作
员必须手动裁剪页面照片。互联
网档案馆最近训练了一个定制的机器学习模型,使其能够自动建议页面边界,从而使工作人员的处理速度翻倍。此外,一个开源机器学习工具可以将图像转换为文本,使书籍可搜索,馆藏也可用于批量研究、交叉引用、文本分析,以及为有阅读障碍的人士朗读。
卡米说:“自 2021 年以来,我们已经将 1400 万本书籍、文件、缩微胶片、记录等各种资料以 100 多种语言提供检索和访问。”
,互联网档案馆的工程师们试用
了一款元数据提取器,该工具可以自动从数字化图书中提取关键数据元素。这些额外的信息可以帮助图书馆员将数字化图书与其他已编目的记录进行匹配,从而开始解决档案馆馆藏中元数据有限的图书积压问题。人工智能还被用于协助撰写杂志和报纸的描述,将每件图书的描述时间从40分钟缩短到10分钟。