南昌职业大学谢娟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南昌职业大学申请的专利基于大数据的数据清洗方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121388402B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511958736.4,技术领域涉及:G06F18/10;该发明授权基于大数据的数据清洗方法及系统是由谢娟;张会;苏翠竹;宋程设计研发完成,并于2025-12-24向国家知识产权局提交的专利申请。
本基于大数据的数据清洗方法及系统在说明书摘要公布了:本发明涉及数据清洗技术领域,具体涉及基于大数据的数据清洗方法及系统,该方法包括:根据预先获取的待监测活动正式进行期间内下单的每个目标用户在待监测活动预热期间内的平台使用情况,确定每个目标用户对应的用户平台使用指标;确定每个目标用户对应的用户平台活跃指标和用户行为深度指标,从而确定每个目标用户对应的刷单可能指标;筛选出真实刷单用户;从所有目标用户对应的待监测活动参与信息中清除所有真实刷单用户对应的待监测活动参与信息,实现数据清洗。本发明通过分析活动期间内的平台使用情况、商品浏览情况、商品咨询收藏情况和下单分布情况,相对精确地实现了真实刷单用户的识别,从而提高了数据清洗的准确度。
本发明授权基于大数据的数据清洗方法及系统在权利要求书中公布了:1.一种基于大数据的数据清洗方法,其特征在于,包括以下步骤: 将待监测活动划分为预热期间和正式进行期间两个特定阶段,其中所述预热期间为活动正式开始前的规定时间段,所述正式进行期间为活动正式开始后的核心交易时间段; 根据预先获取的待监测活动正式进行期间内下单的每个目标用户在待监测活动预热期间内的平台使用情况,确定每个目标用户对应的用户平台使用指标;平台使用情况包括每个目标用户在待监测活动预热期间内每个预设时间周期内登入目标电子商务平台的次数、登入目标电子商务平台的总时长、以及浏览的商品总数; 根据每个目标用户对应的用户平台使用指标,以及预先获取的每个目标用户在待监测活动预热期间内的同种类别商品浏览情况,确定每个目标用户对应的用户平台活跃指标,包括:对每个目标用户在所述待监测活动预热期间内浏览过的所有商品进行聚类,得到每个目标用户对应的各个目标聚类簇,其中,同一个目标聚类簇内的商品属于同一个商品类别; 将每个目标聚类簇内的商品数量,确定为每个目标聚类簇对应的商品代表数量; 根据每个目标用户对应的所有目标聚类簇对应的商品代表数量的均值,以及每个目标用户对应的用户平台使用指标,确定每个目标用户对应的用户平台活跃指标; 根据预先获取的每个目标用户在待监测活动预热期间内的商品咨询收藏情况,以及每个目标用户对应的用户平台活跃指标,确定每个目标用户对应的用户行为深度指标; 根据每个目标用户在待监测活动正式进行期间内的下单分布情况、每个目标用户对应的用户行为深度指标、以及每个目标用户所使用IP地址在同一家店铺的出现情况,确定每个目标用户对应的刷单可能指标; 基于所有目标用户对应的刷单可能指标,从所有目标用户中筛选出真实刷单用户; 从预先获取的所有目标用户对应的待监测活动参与信息中清除所有真实刷单用户对应的待监测活动参与信息,实现数据清洗。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南昌职业大学,其通讯地址为:330100 江西省南昌市安义县前进东路8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励