在2010年海地发生地震后,有10万人丧生,援助机构遍布全国各地,调查幸存者逃离的地点。但是,斯德哥尔摩卡罗林斯卡研究所(Karolinska Institute)全球健康研究专业的研究生Linus Bengtsson认为他可以从远处回答这个问题。他推断,许多海地人将使用他们的手机,而这些电话将通过电话塔,这可能使研究人员可以估计人员所在的位置。Bengtsson说服海地最大的电话公司Digicel共享地震前后数百万条通话记录中的数据。Digicel用随机号码替换了呼叫者的姓名和电话号码,以保护他们的隐私。
Bengtsson的想法奏效了。当时分析或完成分析的速度不够快,无法帮助海地的人们,但在2012年,他和他的合作者报告说,海地首都太子港的人口在此后不久下降了近四分之一。地震,并在接下来的11个月中缓慢上升1。该结果与联合国进行的深入实地调查一致。
人道主义者和研究人员感到非常兴奋。电信公司仔细检查呼叫详细记录,以了解客户的位置和电话习惯并改善他们的服务。研究人员突然意识到,这类信息可能有助于他们改善生活。低收入国家甚至不进行基本的家庭统计,因为这些国家很少进行昂贵的家庭调查,而且许多人没有智能手机,信用卡和其他技术,而这些技术都留下了数字痕迹,这使得富裕国家也可以使用远程跟踪方法有用的补丁。
自地震以来,科学家在“榙一息”的专栏下工作,分析了巴基斯坦,孟加拉国,肯尼亚和至少两个其他中低收入国家的数千万电话所有者的电话。人道主义团体说,他们利用结果提供援助。研究人员将通话记录与其他信息结合起来,以预测传染病的传播方式,并确定贫困,社会隔离,暴力等等的发生地点(请参阅“为美好而声”)。
至少有20家移动电话公司将其专有信息捐赠给了此类工作,其中包括在100个国家/地区的运营商,它们支持由国际移动电话协会GSMA发起的一项名为“大数据促进社会公益”的计划。联合国,世界银行,美国国立卫生研究院和华盛顿西雅图的比尔及梅琳达·盖茨基金会已投入大量资金支持这项研究。Bengtsson在斯德哥尔摩与他人共同创建了一个名为Flowminder的非营利组织,该组织处理大量的呼叫数据集,以挽救生命。
然而,随着以数据换取良好项目的吸引力越来越大,一些研究人员开始质疑他们是否能给社会带来足够的好处,而不是被滥用。这个问题很难回答。援助机构对其项目的细节保密。GSMA赞扬了一些针对流行病和灾难的有效数据分析方法,但很少提及经过同行评审的研究来支持这些说法。在公共卫生,计算机和社会科学领域,十年来已发布的通话记录研究尚未显着地帮助他们追踪的社区。
同时,由于缺乏相关的同意,人们的担忧正在增加。即使是匿名数据集也有可能侵犯隐私;以及对监视感兴趣的商业或政府实体滥用的可能性。批评者可以指出这些项目带来的任何具体危害。耶鲁大学数据责任研究人员纳撒尼尔·雷蒙德(Nathaniel Raymond)认为,但可以想象,政府会把在一个善意的通话记录项目中被发现的政治异议人士围捕起来,或者是使用贩运人口贩子利用结果来寻找绝望的寻求庇护的人。在康涅狄格州纽黑文。他和其他人说,现在该创建彻底的指南,以评估使用通话记录的以数据为基础的研究的利弊。他说:“您对我们可能出于善意可能造成的伤害了解得不够多。”
危机呼吁
当历史学家回顾这个时代时,他们可以称之为手机时代。2017年,超过50亿人拥有他们,占全球人口的三分之二。据GSMA称,到2025年,这一比例预计将达到71%。尽管并非每个人都拥有一部电话,但Flowminder和其他研究人员已经证明,通话记录分析可以估计人口的分布和流动。政府机构,包括荷兰,阿富汗和刚果民主共和国(DRC)的政府机构,现在正在探索如何将通话记录纳入人口普查。许多低收入国家都非常缺乏这种信息:刚果民主共和国上一次完整的人口普查是在1984年出版的。 Flowminder现在正在帮助它。
援助组织也使用这些数据。该机构项目官员乔纳森·里弗斯(Jonathan Rivers)表示,设在罗马的联合国世界粮食计划署分析了匿名的通话记录,以找出人们在2015年尼泊尔地震后需要粮食或现金援助的地方。Flowminder和联合国小组估算了地震发生后逃离首都加德满都的人数,去向和返回时间。里弗斯说,该机构在全球范围内开展此类项目,但拒绝透露其他例子。它很少将报告公开。他说,保密的一个原因是,提供数据可用的电话公司担心会受到订户的强烈反对,这些订户不希望共享自己的位置,甚至是匿名的。
通常,研究人员从匿名的呼叫详细记录中收集结果,这些记录大致显示了在何时何地进行短信和电话呼叫。然后将结果汇总成组,以便研究人员可以了解人口中从一个点到另一个点的旅行比例(请参阅“保护隐私”)。GSMA社会公益大数据计划负责人Jeanine Vos说,电话公司在法律上不需要用户同意才能共享匿名和汇总的信息。她解释说:“他的数据不再附于任何个人。”当要求订户同意时,在激活电话SIM卡时,通常会在选择退出的基础上精简其签订的合同。
埃博拉病毒争议
在2014年塞拉利昂,几内亚和利比里亚的埃博拉疫情爆发高峰期间,Flowminder,联合国和其他机构的流行病学家敦促获取匿名的通话记录,认为这些信息可以帮助遏制危机。Bentsson和他的同事在《 PLOS Currents》中写道:“不可否认的是,在像埃博拉疫情这样的公共卫生紧急情况下,这些数据的价值是不可否认的。”九月份爆发。
但是当地一些研究人员不同意。加拿大伯纳比的西蒙·弗雷泽大学的人类学家苏珊·埃里克森说:“他们提出的建议甚至没有逻辑上的作用。”与高度传播的空气传播感染不同,埃博拉病毒仅通过直接接触被感染的体液传播。因此,埃里克森认为,量化人口的迁移方式并不能揭示病毒的传播方式。要说服有症状的人进入诊所,将他们隔离起来以防止进一步的感染,这迫在眉睫。受埃博拉疫情打击的国家/地区的官员在通话记录分析方面没有道德准则,因此花了一些时间来研究如何规范它们。埃里克森说,那时候本来可以花更多的时间来处理不断升级的危机。
利比里亚以隐私为由,决定不允许进行这项研究。但是Bengtsson和他的同事从塞拉利昂获得了匿名呼叫记录的访问权限。这些记录没有帮助追踪埃博拉病毒,但证实了20152年3月下旬该国三天旅行禁令期间的旅行人数减少了多少。尽管成效不大,但杂志仍然登上头条,称通话记录可以预测埃博拉袭击的地点。Bengtsson和他的同事在2018年写道:最近的危机已经非常清楚地表明,不允许合格的研究人员访问和使用宝贵的手机数据。 / p>
如此有力的陈述使研究人员感到不安,他们说,他们目睹了在危机期间推出了太多技术实验,而这些实验并没有帮助最需要它的人。北卡罗来纳州达勒姆市杜克大学数字治理研究人员肖恩·麦克唐纳(Sean McDonald)警告说,危机可以作为快速分析通话记录的借口,而无需先使用框架来评估通话记录的价值或评估潜在的危害。
在接受《自然》杂志采访时,本格森正谈到通话记录分析的局限性,称它们不能遏制埃博拉病毒。但是他仍然认为它们是无价的,因为它们可以告诉官员或援助人员人口的流动方式,这可能是有用的-尽管他并不确定具体如何。
疟疾迁移
流行病学家研究了通话记录如何有助于抗击其他疾病,包括非洲和亚洲的疟疾,巴基斯坦的登革热和海地的霍乱。2012年,研究人员研究了肯尼亚近1500万手机用户的记录4,并量化了在维多利亚湖东北部工作的人们的季节性迁徙情况,维多利亚湖是疟疾的一个问题。研究人员建议,官员在工人返回的城镇加强对疟疾的监测。但尚不清楚结果是否需要还是有用。疟疾控制人员尚未将分析纳入其工作。负责调查的马萨诸塞州剑桥市哈佛大学的流行病学家Caroline Buckee说:“能力和监管部门尚不具备将其作为应对措施的自动组成部分。” / p>
Buckee的重点已转移到东南亚,那里出现了耐药性疟疾。她的团队与挪威电信公司Telenor合作,该公司在亚洲开展业务。在今年四月报道的一项研究中,研究人员将孟加拉国通话记录的分析与疟疾寄生虫运动的信息相结合,这些信息是从血液样本中的寄生虫的遗传分析中获得的。他们发现,疟疾可能从该国几个地方进口到孟加拉国西南地区5。尽管没有迹象表明该结果已经付诸实践,但Telenor Research的资深科学家Kenth Eng酶-Monsen表示:“这只是时间问题。”在新闻稿中,他走得更远,指出:“他的研究证明,我们在对抗疟疾方面拥有强大的武器。”该公司还与研究人员合作,在缅甸和泰国进行了类似的研究。
但是这种促销方式使疟疾研究人员感到不安,他们坚信这些信息是有帮助的,特别是考虑到缺乏用于抗击该疾病的可靠方法的资源,例如卫生工作者,蚊帐,杀虫剂和疟疾药物。杜克大学疟疾研究人员,位于缅甸的Myaing Nyunt说:“从智力的角度来说,[手机研究]颇具吸引力。“我想的是,在乡村,实际工作变得越来越难以维持。”她指出,过去几年来,全球用于疟疾的资金已停滞不前,并取得了进展。
可以对寄生虫遗传学的研究提出相同的实际论据。但是Nyunt说,通话记录分析使她更加麻烦,因为人们没有同意参加。
开发数据
2012年,移动电话公司Orange与联合国和几所大学的数据科学家一道举办了“发展大行动”挑战赛,以鼓励研究人员探索呼叫详细记录的积极用途。电话公司主要分析记录以促进业务发展,联合国全球脉动计划负责人罗伯特·柯克帕特里克(Robert Kirkpatrick)说,这是利用大数据的一项举措。他说:“我想展示如何将其用于公共利益。”
Orange使科学家能够分析来自Côted'voire的客户的匿名呼叫记录。在一个项目中,研究人员发现,在科特迪瓦发生小规模暴力事件之前,简短的电话就激增了,并建议未来的分析可以帮助官员预测危险并进行干预,“但是这个想法尚未被采纳”。
其他电话运营商接管了挑战。2017年,特雷克电信和联合国小组邀请研究人员研究通话记录如何改善土耳其叙利亚难民的生活。Trumrk Telekom匿名化并汇总了数据,但根据订户在注册SIM卡时提供的识别形式,标记了可能属于难民的通话记录。
由安卡拉中东技术大学的一个小组领导的一个项目发现,生活在相对便宜的社区中的难民“会内向”。很少在这些地区以外旅行。该小组发布了在线地图,确定了难民的工作地点和家园,并绘制了难民向土耳其榛子种植园的迁徙图。该小组建议,外来务工人员可以从那里的更多诊所和儿童保育中受益。
但是没有迹象表明调查结果引发了对难民有所帮助的行动。评论家们认为,诸如难民挑战之类的开放式分析,为了探索大数据而在敏感信息中游刃有余,而不是对研究中的人们有益。伦敦的隐私国际组织的负责人亚历山大·皮尔洛·德·科比昂(Alexandrine Pirlot de Corbion)提倡“保护隐私权”,他说:“除了使用侵入性技术通过移动技术来跟踪人们之外,没有其他方法可以理解孤独的难民如何。” 。她补充说,找出难民是否与世隔绝的另一种方法是问他们一些问题,这使他们可以决定分享什么。
土耳其计算机工程师,帮助组织难民挑战的阿尔伯特·阿里·萨拉赫(Albert Ali Salah)现在在荷兰乌得勒支大学,为该项目的价值辩护。他认为,任何想伤害土耳其360万叙利亚难民中任何一个的人都已经知道他们的邻居。但是通话记录情报可以通过向决策者提供有关难民流动的定量信息来帮助他们。道德委员会对结果进行了审查:例如,当研究表明难民在非法地点工作时,该委员会告诉他们不要公布调查结果。
对于这种数据挑战无助于人们的指控,柯克帕特里克表示,探索是必要的第一步。他说,通话记录研究的下一阶段应该是成本效益分析,以分析进行研究,进行干预并评估社区优势所需的投资。
安全与同意
同时,探索性研究仍在继续。但是Bengtsson和其他人正在解决有关同意和数据安全性的担忧,这不仅是因为一个负面故事(即使危害很小)也可能引起强烈反对,这可能会阻止电话公司开放其通话记录以免费学习。纽约市旨在确保大数据服务的联盟Data-Pop Alliance的负责人Emmanuel Letouz茅说:“现在是时候建立标准,以安全,大规模和合乎道德的方式进行这项工作。”全球人民的利益。
社区内部施加了一些变革的压力。为了向同事展示匿名的脆弱性,伦敦帝国理工大学的应用数学家伊夫·亚历山大·蒙特乔耶(Yves-Alexandre de Montjoye)在2013年报告说,每人只有四个数据点,匿名手机数据集中150万呼叫者中的95%可以被识别6。为了减少恶意行为的人保留记录并识别个人的机会,许多研究人员现在试图对保留在电话公司服务器上的数据进行分析。Flowminder和联合国世界粮食计划署就是其中之一。河流解释说:“不要冒险了。”
Letouz茅,de Montjoye及其同事正在塞内加尔和哥伦比亚试行一个名为开放算法(OPAL)的系统。除了在电话公司的服务器上运行分析之外,他们的模型还包括一个委员会,负责审查和确定研究人员的问题,以使分析的数据不太具体。例如,如果援助人员想知道每周有多少人离开塞内加尔首都达喀尔,委员会可以决定应按天而不是按小时汇总记录。这减少了结果可以回答的其他未经批准的问题。蒙特乔耶说:“这不是一个完美的系统,但我们正在设法找到一种减轻风险的方法,同时确保数据能被永久使用。”
自去年以来,包括Flowminder和总部位于欧洲的电话公司在内的组织必须遵守欧盟的一般数据保护法规。尽管匿名和汇总的数据似乎是免税的,但勒图兹茅认为法律暗示了隐私趋势,并建议数据科学家应考虑如何将同意纳入研究。OPAL计划向订户发送一条短信,询问他们是否要退出,这引起了Letouz茅的一些担忧。他说:“研究表明,给人们一种选择权时,您会损失大约一半。”他想通过说服人们学习的价值并向他们保证数据安全来改变这种状况。
意外的后果
数据安全和人权倡导者表示,尽管可以接受技术更改,但仍需要进行更仔细的风险评估,因为不需要对记录进行黑客攻击以造成损害。“如果我汇总了得克萨斯州边界的数据,该数据显示了半夜从洪都拉斯来到沙漠中部的人的流动,该怎么办?这是高度脆弱人群的标志,”雷蒙德说。
风险因国家而异。例如,荷兰国家统计局正试图将匿名的通话记录分析纳入其人口普查中,但结果却受到法律的严格保护,即使受到警察的保护,那里的统计学家May Offermans告诉《自然》。以个人身份。但是,即使有国家,许多国家也无法很好地执行数据隐私法。其他人则有侵犯人权的历史。
由于这些原因,批评家担心GSMA的社会福利大数据倡议包括像土耳其,缅甸,中国和俄罗斯这样的政府定期跟踪人员的国家。对此,GSMA表示,其网络中的电话公司不会共享可识别的数据,并且只有在法律要求的情况下,它才会将通话记录移交给政府机构。
研究人员分析了拥有过多政府机构的国家的通话记录,经常说他们访问的信息与当局看到的相比显得苍白,从而证明了他们的工作合理。但是批评者反驳说,通过采取这种态度,科学家正将侵犯隐私合法化。雷蒙德说,一个组织最近要求他的团队评估在一个专制国家计划进行的通话记录研究。(他不会透露何时何地。)他的团队指出,这项研究可以帮助军政府学习如何追踪人口,包括他们过去针对的人群。该组织取消了该项目。
雷蒙德(Raymond)的激情源于他在2012年为演员乔治·克鲁尼(George Clooney)资助的一项名为“卫星前哨计划”(Satellite Sentinel Project)的“以数据换好数据”项目工作时犯下的悲剧性错误。雷蒙德和他的同事们张贴了苏丹一条新路的卫星图像,他们认为这些图像可以用来运输坦克和武器。两天后,一个苏丹叛军组织在其中一张照片中的一个十字路口附近伏击了一名建筑工人,并劫持了29人作为人质。发布图像的时间和攻击时间表明,雷蒙德的行动可能已经损害了生命。他说,回想起来,该计划缺乏对可能出问题的彻底评估,其目标是否与风险成正比。
雷蒙德说,需要的是更清晰的指导,以决定项目是否具有足够的价值来解决问题。他认为,通话记录分析和更广泛的大数据领域需要美国国家科学院等组织的广泛审查,才能确定应如何审查研究。机构审查委员会,以确保对研究人员的保护,“在通话细节记录,人工智能和大数据处理时代已不适合目的”?他说。由于此类委员会过去主要关注生物医学研究,因此其道德关注围绕保护个人免受直接伤害。他们很少考虑匿名,汇总数据集可能带来的意外后果。
联合国人权理事会于2013年制定的一套原则可能会提供一些指导,其中指出,除非是实现合法目标的唯一方法,否则根据人权法,不应允许数字监视。如果合法性实际上意味着要帮助人们,那么过去十年中几乎没有多少项目可以实现。
本特森承认自己很失望。他说:“坦白说,令我惊讶的是,很多研究都没有被用来做决定。”他解释说,研究人员需要时间来确定如何进行和确证此类研究,决策者需要采取这种做法并对结果采取行动。
即使是通话记录研究的批评家也认为,Flowminder和其他学术团体的某些研究可能有一天被证明是有益的。但是他们说,在探索性项目中需要格外小心,因为涉及真正的人。麦当劳担心将通话记录研究标记为“好产品”会提供一种贴面,该贴面会导致人们忽略潜在的有害副作用,并可能使公司将营销研究标记为有益的研究。他说:“如果你把枪放在桌子上,那部分是你的责任。”“现在我们有了打开武器储存库的人。”
Bengtsson说,Flowminder正在竭尽所能,以确保其工作不会造成伤害。他说:“信息的意想不到的结果总是令人恐惧。”“如果不算所有人,这也是一种歧视。”例如,如果刚果民主共和国政府不知道某个地区有很多人,它将在那建立额外的学校或诊所。
今年将启动更多的通话记录分析。如果像他们的前任一样,这些东西给人们带来的实实在在的好处,那么“为善”的口头禅就可以枯萎了。Offermans说,压力正在传递。他说:“我必须承认,渊源可以使用(通话记录分析)好坏。”“渊博只需要信任领导人和政策制定者就可以善用它。”?/ p>
自然569,614-617(2019)