The rapid digitalization of Hajj and Umrah services in Indonesia has significantly facilitated pilgrims but has concurrently opened avenues for digital fraud through counterfeit mobile applications. These fraudulent applications not only inflict financial losses but also pose severe privacy risks by harvesting sensitive personal data. This research aims to address this critical issue by implementing and evaluating machine learning algorithms to verify application authenticity automatically. Using a comprehensive dataset comprising both official applications registered with the Ministry of Religious Affairs and unofficial applications circulating on app stores, we compare the performance of three robust classifiers: Support Vector Machine (SVM), Random Forest (RF), and Na"ive Bayes (NB). The study utilizes a hybrid feature extraction methodology that combines Textual Analysis (TF-IDF) of application descriptions with Metadata Analysis of sensitive access permissions. The experimental results indicate that the SVM algorithm achieves the highest performance with an accuracy of 92.3%, a precision of 91.5%, and an F1-score of 92.0%. Detailed feature analysis reveals that specific keywords related to legality and high-risk permissions (e.g., READ PHONE STATE) are the most significant discriminators. This system is proposed as a proactive, scalable solution to enhance digital trust in the religious tourism sector, potentially serving as a prototype for a national verification system.


翻译:印度尼西亚朝觐与副朝服务的快速数字化极大地方便了朝圣者,但同时也为通过伪造移动应用程序进行数字欺诈开辟了途径。这些欺诈性应用程序不仅造成经济损失,还通过收集敏感个人数据带来严重的隐私风险。本研究旨在通过实施和评估机器学习算法来自动验证应用程序的真实性,以解决这一关键问题。利用包含在宗教事务部注册的官方应用程序和应用商店中流通的非官方应用程序的综合数据集,我们比较了三种鲁棒分类器的性能:支持向量机(SVM)、随机森林(RF)和朴素贝叶斯(NB)。该研究采用混合特征提取方法,结合应用程序描述的文本分析(TF-IDF)与敏感访问权限的元数据分析。实验结果表明,SVM算法以92.3%的准确率、91.5%的精确率和92.0%的F1分数取得了最佳性能。详细的特征分析显示,与合法性相关的特定关键词和高风险权限(例如READ PHONE STATE)是最显著的区分特征。该系统被提议作为一种主动、可扩展的解决方案,以增强宗教旅游领域的数字信任,并有望作为国家验证系统的原型。

0
下载
关闭预览

相关内容

【NeurIPS2025】迈向开放世界的三维“物体性”学习
【KDD2024】揭示隐私漏洞:调查图数据中结构的作用
专知会员服务
11+阅读 · 2024年8月13日
Auto-Keras与AutoML:入门指南
云栖社区
18+阅读 · 2019年2月9日
读论文Discriminative Deep Metric Learning for Face and KV
统计学习与视觉计算组
12+阅读 · 2018年4月6日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
VIP会员
相关资讯
Auto-Keras与AutoML:入门指南
云栖社区
18+阅读 · 2019年2月9日
读论文Discriminative Deep Metric Learning for Face and KV
统计学习与视觉计算组
12+阅读 · 2018年4月6日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员