当前位置: 首页 > news >正文

网站开发代码编辑器怎样不花钱做网站

网站开发代码编辑器,怎样不花钱做网站,百度知道问答平台,聊城做wap网站公司摘要#xff1a; 本文是一篇pandas/networkx图分析入门#xff0c;对所举的欺诈检测用例进行了简单的图论分析#xff0c;便于可视化及操作。 对于图论而言#xff0c;大家或多或少有些了解#xff0c;数学专业或计算机相关专业的读者可能对其更加清楚。图论中的图像是由若…摘要 本文是一篇pandas/networkx图分析入门对所举的欺诈检测用例进行了简单的图论分析便于可视化及操作。 对于图论而言大家或多或少有些了解数学专业或计算机相关专业的读者可能对其更加清楚。图论中的图像是由若干给定的点及连接两点的线所构成的图形这样的图像通常用来描述某些事物之间的某种特定关系用点代表事物用两点之间的连接线表示二者具有的某种关系在互联网与通信行业中应用广泛。图论分析Graph analysis并不是数据科学领域中的新分支也不是数据科学家目前应用的常用首选方法。然而图论可以做一些疯狂的事情一些经典用例包括欺诈检测、推荐或社交网络分析等下图是 NLP中的非经典用例——处理主题提取。 欺诈检测用例 假设现在你有一个客户数据库并想知道它们是如何相互连接的。特别是你知道有些客户涉及复杂的欺诈结构但是在个人层面上可视化数据并不会带来欺诈证据欺诈者看起来像其他普通客户一样。        只需查看原始数据处理用户之间的连接就可以显示更多信息。具体而言对于通常的基于机器学习的评分模型而言这些特征不会被视为风险但这些不会被认为存在风险的特征可能成为基于图表分析评分模型中的风险特征。 示例三个具有相同电话号码的人连接到具有相同电子邮件地址的其他人这是不正常的且可能存在风险。电话号码本身没有什么价值并不会提供任何信息因此即使最好的深度学习模型也不能从中获取任何价值信息但个人通过相同的电话号码或电子邮件地址连接这一问题可能是一种风险。 下面在Python中进行一些处理 设置数据、清理和创建图表 构造的仿真数据 首先从一个pandas DataFrame开始它基本上是Python中的Excel表 import pandas as pddf pd.DataFrame({ID:[1,2,3,4,5,6], First Name:[Felix, Jean, James, Daphne, James, Peter], Family Name: [Revert, Durand, Wright, Hull, Conrad, Donovan],Phone number: [33 6 12 34 56 78, 33 7 00 00 00 00, 33 6 12 34 56 78, 33 6 99 99 99 99, 852 0123 4567, 852 0123 4567],Email: [felix.revertgmail.com, jean.durandgmail.com, j.customgmail.com, pd.np.nan, j.customgmail.com, pd.np.nan]}) 从代码中看到先加载数据以df表示。下面对其做一些准备需要连接具有相同电话号码和相同电子邮件的个人由其ID表示。首先从电话号码开始 column_edge Phone number column_ID IDdata_to_merge df[[column_ID, column_edge]].dropna(subset[column_edge]). drop_duplicates() # select columns, remove NaN# To create connections between people who have the same number, # join data with itself on the ID column. data_to_merge data_to_merge.merge(data_to_merge[[column_ID, column_edge]].rename(columns{column_ID:column_ID_2}), oncolumn_edge ) 处理的数据看起来像这样 从图中看到里面有一些联系但存在两个问题 个人与自己联系在一起从数据中看到当X与Y连接时Y也与X连接有两行数据用于同一连接。下面让我们清理一下 # By joining the data with itself, people will have a connection with themselves. # Remove self connections, to keep only connected people who are different. d data_to_merge[~(data_to_merge[column_ID]data_to_merge[column_ID_2])] \.dropna()[[column_ID, column_ID_2, column_edge]]# To avoid counting twice the connections (person 1 connected to person 2 and person 2 connected to person 1) # we force the first ID to be lower then ID_2 d.drop(d.loc[d[column_ID_2]d[column_ID]].index.tolist(), inplaceTrue) 下面数据看起来像这样 从图中看到1和3连接5和6也连接。我们对电子邮件地址也进行同样的处理。下面构建一个图表将在这里只分享代码的一部分因为添加全部代码比较棘手项目代码地址在文末给出。 import networkx as nxG nx.from_pandas_edgelist(dfd, sourcecolumn_ID, targetcolumn_ID_2, edge_attrcolumn_edge)G.add_nodes_from(nodes_for_addingdf.ID.tolist()) 下面进行数据可视化 使用networkx进行图形可视化 简单的nx.draw(G)代码就能获得以下内容 从图中看到这是一个相当有趣的形式但是我们看不出图中的每个点代表的是谁谁和谁之间有什么连接。下面将其具体化 从图中可以看到 4个人通过2个不同的电话号码和1个电子邮件地址连接在一起后续还应该进行更多的调查 真正实现工业化的下一步 让我们回顾一下我们前面做过的事情 根据用户数据库创建图表自定义可视化帮助我们发现潜在奇怪的模式        如果你是业务驱动的并希望一些专家使用你已经完成的工作那么你的下一个重点应该是将查找多个人连接在一起的这一过程自动化或风险模式检测通过图形可视化和原始数据自动创建可视化和创建自定义仪表板的过程        本文不会在这里详细介绍上述内容但是会告诉你如何继续进行上述两个步骤 1.风险模式检测 这里有两种方法 从你认为有风险的人或你被发现为欺诈者的人那里开始检查他们与其他人的关系。这与机器学习相关这是一种“有监督”方法。更进一步你还可以从机器学习评分例如使用XGBoost开始寻找他们之间存在的紧密联系。从奇怪的模式太多的连接、密集的网络...这是“无监督”的方法。        在我们举的例子中我们没有已知的欺诈者所以我们将采用上述的第二种方法。Networkx已经实现了完全正确的算法degree( )、centrality( )、pagerank( )、connected_components( )......这些算法可以让你以数学的形式定义风险。 2.为业务创建可视化和自动化分析 对于大多数数据科学家来说这内容听起来是老派但快速做到这一点的方法就是使用Excel。        Xlsxwriter软件包可帮助你粘贴风险人物图表中的数据并将我们创建的图表图像直接粘贴到Excel文件中。通过这种操作之后你将获得每个风险网络的仪表板如下所示 对于每个具有潜在风险的网络你都可以自动地创建仪表板让专家完成他们的工作。同样你也可以在信息中心中添加一些指标涉及的人数、不同电话号码的数量及电子邮件地址等。        全文源码在此希望这篇文章对你有所帮助。 原文链接 本文为云栖社区原创内容未经允许不得转载。
http://www.pierceye.com/news/881719/

相关文章:

  • 军队 网站备案安卓手机软件开发平台
  • 湖北交投建设集团网站泰安网络公司行情
  • 做排版的网站绍兴网站建设专业的公司
  • 深圳专业网站建设公司济南建设网站
  • 广西建设职业技术学院网站做的比较好的二手交易网站有哪些
  • 北辰网站建设公司wordpress79元主题
  • 网站怎么绑定织梦广东网站建设968
  • ps扩展插件网站业务平台
  • 富阳设计网站广州网站设计公司
  • 演讲网站开发背景wordpress 1h 1g
  • 广州十度网络网站开发最好网站被挂马怎么办
  • 网站建设及维护费算业务宣传费网站如何做触屏滑动效果
  • 如何查询一个网站所属的主机免费可以绑定域名网站空间
  • asp.net网站开发教程品牌型网站建设
  • 海南网站网络推广建设网站需要注意的事项
  • 营销外包网站网站类别标签文本
  • 企业概况简介解答网站内容优化策略
  • ImQQ网站是怎么做的做网站把自己做死
  • 房产网站制作流程php网站开发教程网
  • 小程序商城名字谷歌优化技巧
  • 备案的时候需要网站吗seo搜索引擎优化公司
  • 网站 空间转移wordpress后台点击菜单没反应应
  • 企业网站可以自己做国外域名交易网站
  • 龙岗网站建设费用明细国外的服务器做的网站在国外能打开在国内打不开是什么原因
  • 个人网站的设计与实现摘要东莞学校网站建设
  • 深圳建设局招标网站网站空间pdf下载不了
  • 中国网站建设服务中心百度搜索风云榜电脑版
  • 开发网站性能监控网站开发常见技术问题
  • wordpress 手风琴插件长沙网站优化联系方式
  • 上海松江水处理网站建设做网站项目