使用同类组分析器识别侵入式移动应用程序

原标题:Identifying Intrusive Mobile Apps using Peer Group Analysis
链接:https://android-developers.googleblog.com/2017/07/identifying-intrusive-mobile-apps-using.html
作者:Martin Pelikan,Giles Hogben和Ulfar Erlingsson (谷歌安全和隐私小组)
翻译:arjinmc

移动应用程序娱乐和协助我们的日常,可以轻松与亲朋好友沟通,并提供地图和电子钱包的等工具。但是,这些应用程序会获取更多设备的信息超出它们自身功能实际需要,例如来获取组件的个人信息和传感器数据,如摄像头和GPS跟踪器。

为了保护我们的用户并帮助开发人员驾驭这个复杂的环境,Google会分析Google Play中每个应用的隐私和安全信号。然后我们对比有类似的功能的应用,称为功能同类。创建同级群使我们能够校准我们对用户期望的估计,并确定可能被认为是不安全或侵入性的行为的足够界限。此过程有助于检测收集或发送敏感数据而不需要明确的需求的应用程序,并使用户更容易找到提供正确功能并尊重其隐私的应用程序。例如,大多数着彩色图书应用程序不需要知道用户的精确位置才能运行,这可以通过分析其他彩色图书应用程序来建立。相比之下,地图和导航的应用程序需要知道用户的位置,经常需要获取GPS传感器。

创建应用程序对同类组的一种创建一组固定类别的方法,然后将每个应用程序分配到一个或多个类别,例如工具,生产力和游戏。然而,固定类别太粗糙和不灵活,无法集中捕捉和跟踪快速变化的移动应用的许多区别。这种类别的手动策划和维护也是一个乏味且容易出错的任务。

为了解决这个问题,Google开发了一种用于集成具有类似功能的移动应用程序的机器学习算法。我们的方法使用深入的矢量嵌入学习来识别具有类似功能的应用程序的同类组,使用应用程序元数据(如文本描述)和用户指标(如安装)。然后,根据每个应用程序的请求权限及其观察到的行为,同类组用于识别与隐私和安全相关的异常潜在有害信号。不同类等群体及其安全信号之间的相关性有助于Google的不同团队决定哪些应用程序可以推广和确定哪些应用程序值得我们的安全和隐私专家更仔细的看待。我们还使用结果来帮助应用开发人员改善其应用的隐私和安全性。

img
应用程序分为类似功能的组,在类似应用程序的每个集群中,已建立的基准用于查找异常的隐私和安全信号。

这些技术基于早期的想法,例如使用同类组来分析与隐私有关的信号,深度学习语言模型以使这些同类组更好,并进行自动数据分析得出结论。

Google的许多团队合作创建了这个算法和周围的过程。感谢几位重要的团队成员,包括Andrew Ahn, Vikas Arora, Hongji Bao, Jun Hong, Nwokedi Idika, Iulia Ion, Suman Jana, Daehwan Kim, Kenny Lim, Jiahui Liu, Sai Teja Peddinti, Sebastian Porst, Gowdy Rajappan, Aaron Rothman, Monir Sharif, Sooel Son, Michael Vrable, and Qiang Yan。

有关Google在Android上发现和打击潜在有害应用程序(PHA)的更多信息,请参阅Google Android Security Team的潜在有害应用程序分类

参考

S. Jana, Ú. Erlingsson, I. Ion (2015)。苹果和橘子:用同类组分析检测最不利特权违规者。arXiv:1510.07308 [cs.CR]。

T. Mikolov,I. Sutskever,K. Chen,GS Corrado,J. Dean(2013)。词语和短语的分布式表现及其构成。神经信息处理系统进展26(NIPS 2013)。

Ú。Erlingsson(2016)。数据驱动的软件安全:模型和方法。第29届IEEE计算机安全基金会研讨会论文集(CSF'16),Lisboa,Portugal。

results matching ""

    No results matching ""