Odkrycie: Nowa strategia dla prywatnej wyszukiwarki internetowej

大家都知道我们在网上共享的细节应该谨慎,但是我们搜索的内容也可以泄露有关我们的信息。当我们搜索方向时,我们的位置会变得更容易被猜测。对照受损的数据库检查密码会暴露我们自己的信息,有潜在的泄露风险。

这些情况引发了一个密码学中的关键问题:我们如何在不透露我们正在访问的内容的情况下从公共数据库中检索信息?这就像从图书馆借书,而图书管理员不知道我们具体要求的是哪本书。

为了解决这个问题,被称为私人信息检索问题的问题,很多科学家多年来一直在努力开发私人访问数据库的策略。其中一个主要目标,尽管在大型数据库中无法实现,是在Google上进行私人搜索,即在不增加计算负担的情况下对大量数据进行匿名筛选。

如今,三位研究人员开发出了一个长期以来一直被寻求的私人信息检索版本,并将其扩展为一个更广泛的隐私保护策略。他们的工作获得了2023年年度计算理论学术年会的最佳论文奖,打破了实现真正私人搜索引擎的一个主要理论障碍。

1990年代,私人访问数据库的问题变得重要起来。最初,研究人员认为惟一的解决方案是对每次搜索扫描整个数据库,这意味着图书管理员在找到你的书之前要在每一层架子上搜索。因为如果一个搜索错过了某个部分,图书管理员需要知道你的书不在那个区域的一部分。

这种方法在较小规模上运行得足够好,但随着数据库的规模增加,搜索所需的时间也增加。当我们从更大的数据库中获取信息时 – 而互联网是一个相当大的数据库 – 这个过程变得低效。

在2000年代初,科学家们开始怀疑他们可以通过数据库预处理来绕过完全扫描的障碍。粗略地说,这将涉及将整个数据库编码为一个特殊的结构,允许服务器通过只读取该结构的一小部分来响应查询。仔细的预处理理论上可以使单个存储信息的服务器只需一次独立地进行这个过程,并使所有未来的用户能够不增加额外的工作秘密地检索信息。

对于来自东北大学的密码学家丹尼尔·威奇斯来说,这似乎太好了。2011年左右,他开始试图证明这种方案是不可能的。他说:“我确信这是不可能的。”

但是在2017年,两个研究小组发表了改变他想法的结果。他们构建了第一个能够执行这种私人信息检索的程序,但无法证明这些程序的安全性。(密码学家通过显示破解一个系统与解决一个特定的难题一样困难来确定系统的安全性。研究人员无法将其与一个标准难题进行比较。)

因此,即使有了新的希望,威奇斯也认为要真正安全的这些程序版本仍然需要很长时间才能实现。相反,他和他的合著者 – 目前在弗吉尼亚大学的林伟凯(Wei-Kai Lin)和东北大学的伊桑·穆克(Ethan Mook) – 转而致力于他们认为更简单的问题,涉及多个服务器存储数据库的情况。

在他们探索的方法中,数据库中的信息可以转化为数学表达式,服务器可以对其进行评估以提取信息。作者们假设可以更高效地执行这个评估过程。他们根据2011年的一个想法进行了尝试,当时其他研究人员找到了一种通过预处理快速执行这样的表达式的方法,创建了特殊的紧凑值表,允许跳过正常的评估步骤。

这种方法并没有带来任何改进,该小组即将放弃 – 直到他们突然想知道这个工具是否真正适用于所需的单服务器情况。他们精心选择了一个多项式,他们发现单个服务器可以根据2011年的结果对其进行处理,提供了一种安全,高效的搜索方案,威奇斯多年来一直在思考的问题。他们突然解决了这个更难的问题。

最初,作者们并不相信这个结果。威奇斯脑海中闪过的想法是:“我们找出了哪里出错了。”“我们一直试图弄清楚哪里出错了。”

但解决方案经受住了考验:他们真正发现了一种安全的方式来处理单服务器数据库,使任何人都能秘密检索信息。“这超出了我们的期望,”以色列特艺恩理工学院的密码学家尤瓦尔·伊莎伊(Yuval Ishai)说。这是一个“我们甚至不敢奢求的结果”,他说。

构建了私人搜索方案后,作者们转向了现实目标:一个私人网络搜索引擎,它比从数据库中检索信息片段更复杂,威奇斯说。私人搜索方案本身允许进行私人版Google搜索,但资源消耗非常大:你需要自己运行Google的算法,并在需要时秘密从互联网上获取数据。威奇斯表示,对于一种被称为同态加密的广泛方法来说,一个真正的搜索引擎,你向服务器发送请求并期望结果,是一个真正的挑战,同态加密允许对数据进行掩码,使他人在不知道任何信息的情况下进行操作。

传统的同态加密策略会遇到与私人信息检索相同的问题。

常见问题解答(FAQ):
1. 什么是私人信息检索?
私人信息检索是在不透露正在检索的特定数据的情况下访问公共数据库中的数据的过程。

2. 私人信息检索的主要目标是什么?
主要目标是通过允许访问数据而不透露正在检索的特定数据的信息来保护用户的隐私。

3. 为什么私人信息检索很重要?
私人信息检索很重要,因为它可以保护用户免受隐私泄露。