作者:京东科技 贾玉龙
1 背景
随着智能手机的普及和移动互联网的发展,短信作为一种传统的通讯方式,仍然保持着其独特的地位。然而,随着垃圾短信的泛滥,手机自动识别垃圾短信的技术也在不断进步。对于提供服务的企业来说,如何让自己的服务短信不被识别为垃圾短信,而让用户能够看到,成为了一个亟待解决的问题。本文将深入探讨手机自动识别垃圾短信的逻辑。
2 手机自动识别垃圾短信的逻辑
2.1 垃圾短信的定义与特征
垃圾短信通常指未经用户同意或请求,向其发送的具有广告、推销、欺诈等性质的短信。这些短信往往具有以下特征:
•内容重复:垃圾短信的内容往往具有高度的重复性,如频繁出现的促销信息、贷款广告等。
•发送频率高:垃圾短信的发送频率通常较高,有时甚至在短时间内连续发送多条。
•发送者不明确:垃圾短信的发送者往往不明确,或者使用的是伪造的号码。
•含有敏感词汇:垃圾短信中常含有一些敏感词汇,如“中奖”、“贷款”、“促销”等。
2.2 手机自动识别垃圾短信的技术
手机自动识别垃圾短信的技术主要基于文本分析、机器学习、用户行为等多种方法。以下是一些常见的识别逻辑:
•关键词匹配:手机会预先设定一些敏感词汇库,当短信内容中包含这些词汇时,会将其标记为垃圾短信。
•文本相似性检测:手机会对接收到的短信进行文本相似性检测,如果与已知的垃圾短信内容相似度较高,则会被标记为垃圾短信。
•用户行为分析:手机会根据用户的行为习惯,如是否经常回复、是否标记为垃圾短信等,来判断短信是否为垃圾短信。
•机器学习算法:手机会利用机器学习算法对短信进行分类,通过训练模型来识别垃圾短信。
3 手机自动识别垃圾短信的方法
手机自动识别垃圾短信的逻辑和依据主要包括以下方面:
3.1 内容特征分析
• 关键词匹配:系统内置了大量与垃圾短信相关的关键词,如“促销”“免费”“中奖”“办证”“贷款”“赌博”“博彩”等。当短信内容中出现这些关键词时,手机会提高对该短信的怀疑程度。不过,单纯的关键词匹配容易出现误判,例如一些正常短信中可能偶尔提及类似词语,所以通常还会结合其他因素综合判断。
• 语义理解:利用自然语言处理技术对短信的语义进行分析,理解句子的含义和上下文关系。例如,一些看似正常的句子,但结合上下文语境后发现其意图是推销或诈骗等不良行为,手机就会将其识别为垃圾短信。这需要强大的算法和模型支持,能够准确理解文本的语义,避免因字面意思的误判。
3.2 发送行为特征分析
• 发送频率:如果一个号码在短时间内频繁发送大量短信,超出了正常的通信范围,那么该号码发送的短信就很可能是垃圾短信。比如一些广告推销号码会批量发送相同或相似内容的短信。
• 发送来源:对于一些来源不明的号码,特别是一些非正规的、陌生的号码段发送的短信,手机会更加警惕。例如,一些境外号码发送的短信,或者是一些不符合正常号码规则的号码发送的短信,都可能被识别为垃圾短信。
号码特征分析
• 黑名单比对:手机系统会维护一个垃圾短信发送号码的黑名单库,当接收到的短信来自黑名单中的号码时,会直接将其识别为垃圾短信。这个黑名单库可以由手机厂商、运营商或用户自己添加和更新。
• 号码异常特征:一些号码可能存在异常特征,比如号码格式不规范、号码位数不对等,这些号码发送的短信也容易被识别为垃圾短信。
链接和图片特征分析
• 恶意链接检测:如果短信中包含链接,手机会对链接进行检测,判断其是否为恶意链接。恶意链接可能会引导用户进入钓鱼诱导网站、下载恶意软件等,对用户的手机安全造成威胁。检测方法包括分析链接的域名、IP地址、页面内容等。
• 图片特征识别:对于一些包含图片的短信,手机会对图片进行分析,识别图片中的内容是否与垃圾短信相关。例如,图片中包含广告信息、色情内容等,就会被认定为垃圾短信。
用户反馈和机器学习
• 用户反馈:用户可以手动将一些短信标记为垃圾短信,手机系统会根据用户的反馈对这些短信的特征进行学习和记录,以便在未来更好地识别类似的垃圾短信。
• 机器学习算法:一些手机厂商会利用机器学习算法,对大量的短信数据进行训练和学习,不断优化垃圾短信的识别模型。通过分析大量的样本短信,模型可以自动提取出垃圾短信的特征和模式,提高识别的准确率和效率。
4 主流手机厂商识别垃圾短信的逻辑
不同手机厂商过滤垃圾短信、识别垃圾短信的逻辑各有特点,以下是一些常见手机厂商的具体情况:
4.1 华为
• 智能神经网络算法:在最新的 EMUI 系统中,短信的拦截引擎采用智能的神经网络算法。该算法通过对大量短信数据的学习和分析,能够自动识别短信的模式和特征,从而判断短信是否为垃圾短信。这种方式提高了拦截识别的能力,同时大大降低了“误拦”和“漏拦”发生的概率。
• 关键词匹配与语义理解:系统内置了一系列与垃圾短信相关的关键词,当短信内容中出现这些关键词时,会触发垃圾短信的初步判断。并且,华为手机还具备一定的语义理解能力,能够结合上下文对短信的含义进行分析,避免单纯因关键词而导致的误判。例如,如果一条短信中出现了“免费”“中奖”等关键词,但结合上下文发现是朋友之间的玩笑话,就不会被误判为垃圾短信。
• 号码特征分析:对发送短信的号码进行分析,包括号码的来源、格式等。对于一些来源不明、号码格式异常或者是被标记为不良的号码发送的短信,会提高警惕。同时,华为手机还会不断更新和维护一个号码黑名单库,将频繁发送垃圾短信的号码纳入其中,后续来自这些号码的短信会直接被拦截。
• 用户反馈与学习:用户可以手动将一些短信标记为垃圾短信,系统会根据用户的反馈对这些短信的特征进行学习和记录,不断优化垃圾短信的识别模型,提高识别的准确性。
4.2 小米
• 智能拦截功能:MIUI 系统中有“智能拦截”功能,可以把各类垃圾消息智能拦截后归类到不重要通知。该功能基于多种因素进行判断,例如短信的发送频率、内容特征等。如果一个号码在短时间内发送了大量相似内容的短信,或者短信内容中包含常见的垃圾短信关键词,就会被系统拦截。
• 用户自定义设置:用户可以在系统中添加黑白名单,自行设置需要拦截或放行的号码。同时,用户还可以设置关键词黑名单和白名单,根据自己的需求对短信进行过滤。例如,用户可以将“促销”“贷款”等关键词添加到黑名单中,这样包含这些关键词的短信就会被拦截;而将一些常用的、正常的关键词添加到白名单中,确保不会误拦重要短信。
• 机器学习与更新:小米手机会不断收集用户的使用数据,并通过机器学习算法对这些数据进行分析和学习,不断优化垃圾短信的识别模型。随着使用时间的增加,系统对垃圾短信的识别能力会逐渐提高。
4.3 苹果
系统自带的过滤功能:
• 基于机器学习的分类识别:苹果在iOS系统中内置了短信过滤器,其利用机器学习技术来识别短信是否为垃圾短信以及所属的类别。通过对大量短信数据的学习和分析,系统能够识别出垃圾短信的特征模式,比如特定的关键词组合、文本格式、发送频率等,从而对新收到的短信进行判断和分类。例如,如果一条短信中包含大量与推销、诈骗相关的常见词汇,系统就可能将其识别为垃圾短信。
• 信息类别过滤:在iOS 14中,苹果就为垃圾短信引入了“交易”和“促销”两个新的不同类别;iOS 16为短信过滤API增加了12个新的子类别,包括金融、提醒信息、订单、卫生等。这样可以更精细地对短信进行分类过滤,方便用户查看和管理不同类型的短信。
• 过滤未知发件人:用户开启“过滤未知发件人”功能后,来自陌生号码或不在联系人列表中的发件人的短信会被单独分类到“未知与过滤信息”中,与正常的短信分开显示,减少对用户的干扰。
iMessage的相关过滤设置:
• 账号管理:iMessage是苹果自带的即时通讯服务,用户如果收到大量通过iMessage发送的垃圾短信,可以删除用邮箱登陆的账号,只保留手机号码。因为很多垃圾短信是通过用户的邮箱而进行推送的,减少邮箱账号的使用可以降低收到此类垃圾短信的概率。
• 开启过滤功能:开启iMessage的过滤功能后,即使有垃圾短信进来,iPhone也会自动将其分组到【过滤信息】中,不会影响用户接收其他正常短信。
用户反馈与训练:用户可以手动将某些短信标记为垃圾短信,系统会根据用户的反馈进一步学习和优化垃圾短信的识别算法。当用户将一条短信标记为垃圾短信后,系统会记录该短信的特征,并在后续的识别过程中更加准确地判断类似的短信。
第三方应用辅助过滤:App Store中有一些第三方的短信过滤应用,这些应用可以利用先进的智能AI算法等技术,自动识别过滤拦截垃圾短信。它们通常会提供更多的个性化设置和功能,如按号码屏蔽、防短信轰炸等,用户可以根据自己的需求选择安装使用。
4.4 Vivo
• 关键词与规则匹配:系统内置常见的垃圾短信关键词库,当短信内容中出现如“促销”“贷款”“中奖”等关键词时,会触发初步的垃圾短信判断。同时,Vivo手机还会根据一些预设的规则,如短信发送频率异常、号码来源不明等情况,对短信进行进一步的筛查。
• 智能拦截模式:Vivo手机具备智能拦截功能,通过机器学习算法对大量的短信数据进行学习和分析,逐渐掌握垃圾短信的特征和模式,从而提高拦截的准确性。用户可以在设置中开启智能拦截模式,让系统自动过滤垃圾短信。
• 用户自定义设置:用户可以根据自己的需求,在手机的设置中添加短信拦截规则,例如设置关键词黑名单、号码黑名单等,对特定的短信进行拦截。此外,用户还可以选择开启或关闭某些类型的短信通知,如营销短信通知等。
Oppo
• 智能识别与过滤:Oppo手机的系统会自动对收到的短信进行智能分析,识别其中的垃圾短信。通过对短信内容的语义理解、关键词匹配以及发送号码的分析等多方面因素的综合判断,来确定短信是否为垃圾短信。例如,如果短信内容中存在大量的广告宣传用语,或者发送号码是频繁发送垃圾短信的号码,系统就会将其识别为垃圾短信并进行拦截。
• 伪基站短信拦截:Oppo手机具备伪基站短信拦截功能,能够识别并拦截伪基站发送的短信。伪基站是一种非法的通信设备,可以伪装成正规的基站向手机用户发送短信,其中很多都是垃圾短信或诈骗短信。Oppo手机通过对信号特征的分析和识别,能够判断出短信是否来自伪基站,并及时进行拦截。
• 用户反馈与学习:Oppo手机支持用户手动标记垃圾短信,用户将某条短信标记为垃圾短信后,系统会记录该短信的特征,并根据用户的反馈不断学习和优化垃圾短信的识别算法,提高拦截的准确性。
4.5 三星
• 模式识别技术:三星手机利用模式识别技术对短信进行分析。通过对大量垃圾短信样本的学习,建立起各种垃圾短信的模式模型。当接收到新的短信时,系统会将其与已建立的模式模型进行对比,如果匹配度较高,则判断为垃圾短信。这种方式可以有效地识别出一些具有特定模式的垃圾短信,如诈骗短信、推销短信等。
• 号码信誉评估:三星手机会对发送短信的号码进行信誉评估。系统会收集和分析号码的历史发送记录,如果一个号码经常发送垃圾短信,那么它的信誉度就会降低。当接收到来自信誉度较低的号码的短信时,系统会更加严格地进行审查,提高该短信被识别为垃圾短信的概率。
• 安全中心防护:三星手机的安全中心会对短信进行实时监测和过滤。安全中心会不断更新垃圾短信的特征库和拦截规则,以应对不断变化的垃圾短信形式。同时,用户还可以在安全中心中设置短信拦截的级别和方式,根据自己的需求进行个性化的设置。
4.6 荣耀
• 智能防护引擎:荣耀手机拥有专门的智能防护引擎,用于过滤垃圾短信。该引擎通过对短信的发送号码、内容、频率等多方面因素进行综合分析,来判断短信是否为垃圾短信。例如,如果一个号码在短时间内频繁发送大量内容相似的短信,就会被系统判定为垃圾短信发送者,其发送的短信会被拦截。
• 号码识别与分类:荣耀手机会对发送短信的号码进行识别和分类。对于一些常见的垃圾短信发送号码,如营销号码、诈骗号码等,系统会将其标记并进行拦截。同时,对于一些新出现的号码,系统会根据其发送短信的行为和特征进行判断,如果符合垃圾短信的特征,也会被拦截。
• 场景化识别:根据不同的场景和用户需求,荣耀手机的垃圾短信过滤功能还具备场景化识别能力。例如,在用户进行网购后,可能会收到一些商家的促销短信,系统会根据用户的购物行为和偏好,对这些短信进行智能识别和分类,避免将一些有用的促销短信误判为垃圾短信。
4.7 魅族
• 智能拦截系统:魅族手机的智能拦截系统通过对短信的文本内容、发送号码、发送频率等信息进行分析,来判断短信是否为垃圾短信。系统会根据预设的规则和算法,对短信进行自动拦截。例如,如果一条短信的发送号码是一个陌生的虚拟号码,且短信内容中包含大量的广告宣传词汇,系统就会将其拦截。
• 用户反馈与社区共享:魅族手机支持用户手动标记垃圾短信,用户将某条短信标记为垃圾短信后,系统会将该短信的特征上传到魅族的服务器。同时,魅族还建立了一个用户社区,用户可以在社区中分享自己遇到的垃圾短信信息,其他用户可以根据这些信息对自己的手机进行设置,提高垃圾短信的拦截效果。
• 定期更新与优化:魅族会定期更新垃圾短信拦截的规则和算法,以适应不断变化的垃圾短信形式。通过对新出现的垃圾短信特征的学习和分析,不断优化拦截系统,提高垃圾短信的识别准确率。
4.8 一加
系统自带的骚扰拦截功能:
• 智能拦截模式:一加手机的系统会基于一定的算法模型对短信进行智能判断。例如,系统会根据短信的文本内容、发送号码的特征等信息进行分析。如果短信的内容中包含一些常见的垃圾短信关键词,如“促销”“抽奖”“免费”等,或者发送号码是一些已被标记为不良的号码段,系统就会将其识别为疑似垃圾短信进行拦截。这种智能拦截模式能够在一定程度上自动过滤掉大部分常见的垃圾短信。
• 用户自定义拦截规则:用户可以在手机的设置中自行添加垃圾短信关键词。当接收到的短信中包含用户设定的关键词时,系统会自动拦截该短信。此外,用户还可以设置拦截特定号码发送的短信,比如将一些经常发送垃圾短信的号码添加到黑名单中,从而实现精准拦截。
• 拦截通知设置:在拦截规则界面,用户可以设置拦截通知的提醒方式,如显示所有拦截通知、不显示拦截通知或显示除黑名单外的拦截通知等,方便用户及时了解短信的拦截情况。
与第三方应用的协作:
• 号码识别应用:一加手机用户可以安装第三方的号码识别应用,如腾讯手机管家、360手机卫士等。这些应用拥有庞大的号码数据库,能够对来电和短信的发送号码进行快速识别和分类。如果是被标记为骚扰电话、诈骗电话或垃圾短信发送者的号码,应用会自动拦截相关的通信。并且,这些应用还会不断更新数据库,以提高识别的准确性。
• 短信过滤应用:一些专门的短信过滤应用可以与一加手机的系统进行协作,进一步增强垃圾短信的过滤效果。这些应用通常会采用更先进的算法和技术,对短信的内容进行深度分析,识别出潜在的垃圾短信。例如,通过对短信的语义理解、文本模式识别等技术,判断短信是否属于垃圾短信范畴。
5 结论与展望
手机自动识别垃圾短信的技术在不断进步,对于提供服务的企业来说,如何让自己的服务短信不被识别为垃圾短信,而让用户能够看到,成为了一个亟待解决的问题。本文深入探讨了手机自动识别垃圾短信的逻辑,并提出了优化服务短信可见性的策略。通过精准定位目标用户、优化短信内容、合理控制发送频率、提升用户参与度以及加强与运营商的合作等措施,企业可以显著提升服务短信的可见性,提高用户的打开率和回复率。
未来随着技术的不断发展,手机自动识别垃圾短信的逻辑可能会更加复杂和智能。因此,企业服务人员需要持续关注这一领域的发展动态,不断优化自己的服务策略和手段。同时,也需要加强与运营商、第三方服务商等合作伙伴的合作,共同推服务短信的合规性和可见性的提升。只有这样,才能在激烈的市场竞争中脱颖而出,赢得用户的信任和支持。
更多其他内容:
AIGC项目中的【模板进程】方案的设计实践: https://developer.jdcloud.com/article/4123?mid=30
AIGC系统中多个模型的切换调用方案探索: https://developer.jdcloud.com/article/4110
前后端数据传输约定探讨: https://developer.jdcloud.com/article/3900
如何做标准化?: https://developer.jdcloud.com/article/3576
chrome插件新版本(v3版本)中的热更新,即加载更新远程js的方法探索: https://developer.jdcloud.com/article/3852
审核编辑 黄宇
-
通讯
+关注
关注
9文章
900浏览量
34879 -
自动识别
+关注
关注
3文章
220浏览量
22830
发布评论请先 登录
相关推荐
评论