我想要指定的APP里面的管理用户地址APP数据,怎么拿呢

51CTO旗下网站
如何使用WhatsApp收集大量数据(附脚本)
大概在几年之前,WhatsApp开始允许我们在Web浏览器中使用WhatsApp了,接下来,将会给大家演示如何利用WhatsApp的API接口来收集大量有趣的用户信息。
作者:Alpha_h4ck来源:| 14:48
如果你想要拿到所有WhatsApp用户的手机号码、头像、以及状态信息,那么我告诉你,这其实是一件非常简单的事情,而且这些用户甚至都不需要将你添加到他们的通讯录里面。
大概在几年之前,WhatsApp开始允许我们在Web浏览器中使用WhatsApp了。这是一种提升用户体验度的绝佳方法,因为与那手机屏幕里还没巴掌大的九宫格键盘相比,使用键盘来输入信息会更加的方便,而且复制粘贴或者添加附件也非常的简单。虽然优点如此之多,但缺点也肯定会有。坏消息就是,从技术角度出发,我们将有可能利用WhatsApp的Web接口来创建一个庞大的WhatsApp用户数据库。需要注意的是,可能只有一小部分用户不会受到影响:即那些没有修改隐私设置的用户(但WhatsApp并不鼓励这种不修改隐私设置的行为)。接下来,我会给大家演示如何利用WhatsApp的API接口来收集大量有趣的用户信息。
Web版WhatsApp需要通过用户的手机号来与WhatsApp服务器进行连接。简而言之,也就是浏览器只需要根据一个特定的手机号就能让后台服务器返回所有与该手机号有关的信息。可能返回的信息如下:
与用户状态相关的文本信息,例如&嗨,我正在使用WhatsApp&等等;
用户当前的在线/离线状态;
我们发现,上述这些信息是可以通过手机号来请求获取的。也就是说,这个手机号所对应的WhatsApp是否将你添加为好友其实并不重要。因为这种通过手机号来请求用户信息的操作不会受到任何的限制,所以我们就可以创建一个完整的WhatsApp用户数据库,然后保存用户的手机号码、用户头像、状态文本信息、以及在线/离线状态。我们可以通过这些信息构建出一个与用户手机号相关的完整时间轴,而这个时间轴可以告诉我们用户的上线与离线时间。
目前,几乎所有的网站在用户浏览器中呈现内容时,都包含有一种特殊的程序来决定网站的功能及表现形式,这种特殊的程序就是我们所说的JavaScript代码,这些JS代码决定了用户在点击某个按钮或移动鼠标时网站应该产生怎样的动作。除此之外,它们也可以与服务器进行连接,并请求某些类型的数据。当然了,Web端WhatsApp也不例外。它会向WhatsApp的后台服务器发送一个手机号码,几毫秒之后它便会收到有关这个手机号码的信息。对于我们来说,这种JavaScript程序的好处就是任何人都可以查看到它的源代码,而且我们还可以将其用于其他的地方。我正是利用了这种可能性开发出了一个脚本,这个脚本可以向服务器请求大量手机号码所对应的账号信息,更加重要的是,任何一个人都可以编写出这样的一种脚本。下面这张图片显示的是我的脚本请求的400个随机手机号所对应的信息:
隐私方面的担忧
那么,当我们拿到这些信息之后,我们能做些什么呢?首先你要知道的是,任何人都可以创建出这样的一种数据库,我们不仅可以知道一个用户(手机号)何时上线下线,而且还可以知道某个用户头像所对应的手机号码。接下来我跟大家说一个最贴近实际的使用场景。面部识别技术想必大家都听说过吧?这项技术近几年已经发展得很不错了,你可以设想一下,当你走在街上看见了一个美女(或帅哥),然后偷偷拍了一张TA的照片,而现在你只需要将这个照片放到数据库中进行比对,你就可以拿到TA的手机号了。如果这是一个你所讨厌的人,那么你还可以利用TA的照片、手机号、以及其他的信息并通过面部识别系统来登录TA的某些在线服务。是不是很简单呢?这就是我对WhatsApp这个问题所产生的担忧。
WhatsApp给出的回应
我非常支持&负责任的漏洞披露&,所以当我发现了这个漏洞之后,我便立刻与Facebook(因为WhatsApp是Facebook旗下的产品)取得了联系。总而言之,他们已经意识到了这件事情(有可能收集到大量用户数据),但是他们并不认为这个问题与用户隐私有关。他们给出的回复如下:
虽然他们的回复看起来也没什么问题,而且我自己甚至差点都被他们说服了。但是冷静下来仔细想想,总是感觉怪怪的&
不建议非技术人员阅读这部分内容,因为你们可能会看不懂&
Web端WhatsApp使用了一个文档中没有提到的API,你可以随意使用这个API,但你首先得自己弄清楚怎么去使用它。这里,JavaScript
API在与WhatsApp服务器进行通信时使用了一个WebSocket。
我在我的脚本中使用了三个API,第一个是Store.ProfilePicThumb.find(
),我用它来收集用户头像。你可以这样使用它:
请注意,你必须在Web端WhatsApp所运行的同一标签中发送请求,你还需要在页面DOM中添加一个元素。
第二个API是Store.Wap.statusFind(
):它可以收集手机号所对应的文本信息:
第三个API是Store.Presence.find(
),它可以用来请求用户的在线/离线状态:
通过将这些API调用放到一个循环中,我们就可以不断向服务器请求信息了。
注:请不要将其用于非法目的!【编辑推荐】【责任编辑: TEL:(010)】
大家都在看猜你喜欢
头条热点头条热点热点
24H热文一周话题本月最赞
讲师:73162人学习过
讲师:4883人学习过
讲师:12349人学习过
CTO专属活动
精选博文论坛热帖下载排行
20多年以来,《软件工程:实践者的研究方法》一书是最受学生和行业专业人员欢迎的软件工程指南。它在全面而系统、概括而清晰地介绍软件工程...
订阅51CTO邮刊比特客户端
您的位置:
详解大数据
详解大数据
详解大数据
详解大数据
让用户把你的 App 留在手腕上,只要5招
关键字:移动互联 移动应用
  Apple Watch 的出现给智能可穿戴设备市场带来了令人欣喜的变革。但 Apple Watch App 仍需要面临一个巨大的挑战――如何让尝鲜下载的用户留存下来。
  不可否认,Apple Watch 给 App 营销商开辟了一个新的推广渠道。然而,对于 App 营销人员来说,想要提供优良的用户体验可能还需要磨合一段时间。可以先尝试回答以下这五个问题来更好的设计改进 App:
  1. 我的 App 是否能让用户在一瞥之间快速获取信息,是否支持快速操作?
  在智能穿戴设备盛行的时代,为避免,产品在实体和虚拟交付过程中都需要创新。热门约会应用 Tinder 的新颖体验已吸引了不少用户(用户可以选择「喜欢」、或者选择「跳过」推荐人,假如用户喜欢的推荐人对用户同样有好感,那么就可以互发消息、在 上互相关注,甚至是组织线下见面)。在开发 Apple Watch 上对应 App 的时候,Tinder 很好地利用了手表的「Glance」功能,让佩戴者在不打开 App 的情况下获取推荐对象的精简资讯,并配以快速简单的轻扫手势来做更多的选择互动。通过 Tinder,人们可以简单有效的管理各种各样的约会对象,从而获得终极的交互体验。
  很显然,「Glance」功能会在我们需要时刻关注的 App 上,诸如约会、天气、预约、娱乐等应用。比如一个影音娱乐 App 想要让 Apple Watch 的用户知道他们最喜欢的节目即将在 或 的相应 App 上播放,它可以通过设定一个简单指令,就像「加入收藏夹」或创建一个特定的选择按键如「以后提醒我」或「忽略」来引导用户操作。
  通过设计这些按键,App 营销人员可以增加一层控制来分析用户对哪种推送通知更有参与度。更可以通过这些快捷操作来监测现行的营销策略是否有效,推送频率是否过高而使用户有了厌烦情绪想要卸载这个 App。
  2. 我是否能给用户提供最个性化的交互体验?
  越是个性化的设备越需要承载个性化的交互体验,而不是爆炸式的推送一些寡淡无味、客观冗余的消息。App 营销人员应该通过丰富实用的推送消息来抓住 Watch 用户的心。
  例如,在旅行的时候,我会希望 Watch 上的旅行 App 能推我有用的地点和计划,比如登机门或行李转盘的更新或更改信息。在我公司的一些研究中,我们得出这类有针对性的推送消息会比其他标准消息获得高出三倍的转换率。
  当然,在 Watch 上创建个性化的交互体验需要根据 App 的实际用途和用户的操作习惯来调整。例如,电商 App 在进行消息推送后参与度最高比一般情况下高出 278 个百分点,这便是展现推送威力的一个典型例子。
  3. 我的推送通知是否有用户黏性?
  App 营销人员应该记住,在 iOS 系统里用户可以随时取消推送通知。用户的想法是很难掌控的。所以应该考虑的第一个问题是:用户是乐意使用我的 App,还是认为我的 App 是个累赘?虽然这问题对于营销人员来说并不新鲜,但 Apple Watch 的超个性化的可穿戴特质加剧了这个问题的重要性。
  iPad 的问世首次提出了个性化推送通知的概念,提高了用户体验的门槛。用户对直观干净界面的青睐逐渐蔓延到所有的操作互动中。我认为 Apple Watch 也需要有相同的个性化推送设计理念,来增加用户黏性,让用户能在不经意间接收他们需要的信息。
  这种趋势早已开始萌动,并在 Apple Watch 的牵引下更为加速。好的消息是,尽管推送常给用户带来困扰,但多数用户似乎还是很乐意接收推送消息的。在对一亿个推送通知的定向研究中我们发现,52%的用户会选择接收他们。我们也看到,推送通知使得这些应用更有用户参与度与留存度。
  推送消息的关键是要非常地关注用户的参与程度。不要过度复杂化,尽量通过设计简单的互动方式,如一个「Yes」按钮,让用户能快速的毫不费力的处理推送消息。问太多的问题反倒会疏离用户。因为你并不知道用户是否会打开 App,即便他们曾根据自己的喜好订阅了这些内容。
  根据我们的数据显示,只有 7%的用户会打开特定的推送消息。对于大众广播类的消息这个数据则仅有 3%。最近,我在 Apple Watch 上接收的一个最无关紧要的推送是通知一个 有了新功能。这给我的感觉就像收到垃圾邮件一样,被强推了我并未设定的信息(顺便说一句,如果在 App 内部推送这则消息,也许会更容易引起我的注意)。
  4. 我的 Watch 应用是否可以能与无间配合?
  要知道当前 Apple Watch 上的应用并不能独立运行,它们实际都是配套 iPhone 应用的扩展延伸。拿运动类应用 Runkeeper 来说,Runkeeper 的 Watch app 能够显示骑行的英里数和跑步的步伐数,既直观又实用。但是在开始记录你的活动之前,你需要先设置好活动的类型和目标,在 Apple Watch 上设定会略显笨拙,所以更适合在上进行设定操作。
  Runkeeper 很好的利用了这一点。通过收集和分析手机和手表上的 App 实用数据,可以全面的掌握跨设备,乃至跨媒介的可穿戴设备对整体用户体验的影响。从而可以迅速的调整营销策略,并通过 Apple Watch 这个新的参与方式带动更多的用户价值。
  5. 用户是怎样使用我的 Watch app 的?他们对我的推送消息是否感兴趣?
  要改善 Watch App 的用户体验,必须先重视用户的信息反馈。对于可穿戴设备来说,最可贵的一点就是能给营销人员提供海量的。有了这些数据,并通过回答以下几个问题,App 营销人员便能真正了解 Apple Watch 这个新媒介对整体 App 推广战略的影响:
  6. 用户一般使用我的 App 多长时间?用户是否启动了我的 App?他们的使用频率是怎样?哪些用户是最活跃的?
  用户选择在 iPhone 还是 Watch 上接收我的个性化推送?这些推送是否成功的引导了他们去做我安利他们做的事情?在推送发出的 24 小时内用户的活跃度是会上升还是下降?
  7. 用户和 Watch 的交互相比于和 iPhone 或 iPad 的交互有什么不同?我如何利用这些不同来个性化定制推送通知或增进用户体验度?
  关注以上这几点,App 营销人员可以通过不断研究学习和快速改进,为用户提供他们最需要的交互体验。
  总而言之,想让用户把你的 App 留在手腕上?就请充分考虑以上这些关键问题吧。
相关文章:
[ 责任编辑:韩敏 ]
去年,手机江湖里的竞争格局还是…
甲骨文的云战略已经完成第一阶段…
软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。
微信扫一扫
关注Chinabyte正在阅读:中国某广告SDK被爆盗取数据,500余款App躺枪中国某广告SDK被爆盗取数据,500余款App躺枪
  美国时间8月22日,外媒BleepingComputer报道称,中国一款广告软件开发工具包(SDK)正在盗取用户数据并将其发送到中国公司的服务器,这款SDK还嵌入到500多个合法应用程序中,这些应用程序已在Google Play商店上传,并在Android生态系统中下载量超过1亿次。  研究人员称,他们注意到设备向该API服务器发送请求后,已知恶意样本就下载到了干净的智能手机上,于是他们着手调查该SDK 。  经过数月的调查,
移动安全公司Lookout的研究人员发现,开发人员使用SDK的合法功能将恶意命令发送到合法应用程序。根据安装期间从用户收到的合法应用程序的权限,他观察到SDK从用户的设备收集各种数据,但主要是呼叫日志。   此外,
该SDK还强制下载并运行包含在大型加密文件中的代码,这些代码助力了恶意行为。   目前,Google已经禁用了包含该恶意版本的应用,直到应用开发者可以发布更新。  Lookout的专家并没有提及包含该SDK的应用程序的名称,因为他们觉得,这500多个App纯属躺枪。尽管如此,他们还是提供了这些&躺枪App&的一些线索:针对青少年的游戏App(50M-100M的下载量) 天气App(1M-5M的下载量)互联网收音机App(500K-1M的下载量) 照片编辑器App(1M-5M的下载量) 教育、健康和健身、旅游、表情符号,家庭摄像机App   该SDK开发厂商后续发来反馈称:1、其开发人员使用SDK的合法功能将恶意命令发送到合法应用程序&&其实是APP热更新功能,并且新版本已经去掉,没有那么可怕;2、SDK从用户的设备收集各种数据,但主要是呼叫日志&&是为了监测用户通话之后4G网络断掉的问题。
手机论坛帖子排行
最新资讯离线随时看
聊天吐槽赢奖品「我做了一款电商 App,想偷窥用户聊天记录来营销,怎么实现?」「我做了一款电商 App,想偷窥用户聊天记录来营销,怎么实现?」PingWest品玩百家号最近,中国网络用户的隐私权突然觉醒了,各大公司都有点不适应。今日头条被指责偷听、支付宝被 diss 账单默认勾选协议、微信被人说天天看我们聊天记录、百度 App 能偷听你电话、淘宝就更牛了,据说但凡你想买点啥除非己莫为,要么它全知道。以上所有公司官方都在第一时间进行了辟谣和否认,其中一大部分的立论是:做不到、没能力、干不了。真的干不了么?BiaNews 在《深度调查:知名APP利用微信和麦克风推荐商品?答案是……》中进行了用户访谈,抓了一些典型的控诉案例来进行分析,并在编辑部对一部分传说中的偷窥进行了复现。其中还确实有些匪夷所思的场景是可以复现的,比如:iPhone 没越狱系统、使用系统输入法、在微信里提到商品,在隔壁家看到推荐——你晚上想要和朋友吃火锅的意图也能被淘宝看透:在这篇文章的末尾给出的结论中,BiaNews 认为在大多数案例中还是输入法泄露的天机,还有一些是综合用户的位置、支付情况等做出的判断。但是对于上面这种没越狱、第一方输入法、微信和淘宝之间的关联,他们也不太能理解原理是什么。比起谴责,好奇心旺盛的我其实更想知道这究竟是怎么做到的,难道中国互联网最大的两个死对头之间还有不可告人的交易?在我把标题的问题丢给了几个程序员之后,他们给了我两个思路,在这里整理出来给大家看看。路径一:剪贴板在所有当前的分析文章中,都忽略了这一点。iOS 系统允许 App 直接访问剪贴板而无需申请额外的任何权限。关于这一点,大家应该都很熟悉,因为竞争原因,我们早就已经不能在微信里打开淘宝链接了。当我们想把商品分享给微信好友的时候,分享的是什么呢?是一串奇怪的文字,这被称为「淘口令」。用户复制淘口令,进入淘宝客户端,无需粘贴操作,就会自动弹出相应的商品。为了实现这一功能,淘宝每次打开的时候都应该会检查一下用户的剪贴板。如果你的剪贴板里有不是淘口令,但是是商品的东西,淘宝也就顺势给出了推荐。这个路径 iOS 和 Android 通用,因为在开发规范中,剪贴板本就不是信息安全区域。在 Android 上很多 App 都利用这个特性来实现一些功能,比如词典 App 会在你复制一个单词之后自动弹出提示,一些浏览器会在你剪切板有复制 URL 地址的时候自动问你是否打开网页。如果你在和朋友聊买东西,然后用了复制,一进淘宝就发现了对应的推荐,这就会给人一种非常可怕的感觉。但其实,因为 App 永远只能读取你此时此刻的剪切板,所以能够获取的信息十分有限,隐私没那么容易泄露。在手机上主动复制一段话,其实还是很少的。但是在去年苹果更新了 macOS Sierra 之后,推出了一项叫做「通用剪切板」的功能。这项功能是将用户的 Mac 和 iPhone 剪切板通过 iCloud 相连。如果你既是 Mac 用户又是 iPhone 用户,那么你在 Mac 上复制的信息也可能被淘宝读到。而同样的道理在 Windows 平台上也可以实现,Windows 下的每个进程都可以无需额外授权的访问当前剪切板,进程不等于窗口。相当于即便是你没有切换到某个程序,只要这个程序在后台是运行的,也可以一直查看你的剪贴板。这就是在安全要求更高的场景中,密码框不止不准你复制走,甚至连粘贴都不允许的原因——因为你的使用习惯如果是从别的地方把密码复制进密码框,那你的密码已经全宇宙广播了。路径二:iCloud 备份这个路径就比较邪性了,来自一位精通黑产的程序员贡献。看到标题这个问题,他第一反应是淘宝这么大公司是不会这么做的。但这确实是一条可用的通路。他甩给我一条新闻,这条新闻 PingWest 品玩也报过:这个史诗级漏洞就是,长期以来 macOS 的 root 权限几乎对所有程序都是开放的。有了 root 权限,应用程序可以为所欲为而不会有任何系统弹窗提示用户需要输入密码。一条看起来可行的途径是:通过在 Mac 中植入一个程序,获得系统钥匙串,在钥匙串中获得 iCloud 密码,从 iCloud 密码中下载用户的微信备份,解包备份文件获取聊天记录。如果在 Mac 上安装了微信,可能连 iCloud 密码都不用偷,直接在 Mac 用 Root 权限本地读取微信聊天记录。而微信因为比较相信苹果的安全性,所以在备份上的加密并不强。随便搜一搜就能搜到如何解包微信聊天记录的帖子:这种通过第三方工具解包恢复备份的方法,甚至在民间十分流行:这个啥恢复大师当然是第三方工具,而且也能读出微信备份文件里的聊天记录。原本,这样做虽然不符合安全规范,但是安全隐患也并不是很高。谁知道 iCloud 的密码会那么容易被偷呢……直到 macOS 的史诗级漏洞被爆出来。这条路径的成立风险比较高,但价值也比上一条更大。它看到的信息可不是用户的剪贴板那么简单,而是用户的完整全量聊天记录。甚至是一些 App 的应用内行为记录。当然,前提是你的 iCloud 账号没有开启两步验证。如果说上一种是在违法的边缘试探,那这一种就完全是已经违法了。阿里作为一家大公司,这么做的可能性几乎是零。我相信中国的其它大公司,也不可能为了这么一点蝇头小利做风险这么大的事情。因为这要是真的,可不只是被罚到倒闭那么简单。但这并不意味着一些从事黑产的个人和公司不会这么做,也不意味着他们做完之后的数据不会洗白卖给正规公司。一些黑产得到用户数据后,会转售给正规的数据公司,数据公司拿到原始数据之后会象征性的脱敏,然后再卖给正规的互联网公司用于用户画像的建立,所以……破罐破摔吧。怎么讲,这位黑产程序员后续给我引用了一篇国内某个互联网大公司的官方安全博客的文章。里面提到:iOS的的漏洞数量在今年急剧上升,达到了 192 个漏洞,远远超过了 2016 年所发现的 161 个漏洞。iOS 漏洞预计今年将高达 643,同比增加了 4 倍。相比之下,Android 漏洞预计将从 523 下降至 500。而所谓发现,只得是被正义の味方找出来,并且提交了官方进行修复的漏洞。像是 macOS 史诗级提权漏洞这种东西,虽然是今年「发现」的,但其实已经存在很多年的了。而你要问「被发现」的漏洞和被黑产利用的漏洞,比例大概是这样:所幸,现在的黑客们都学会了闷声发大财。即便是拿到了你的 iCloud 帐户,也很少会直接丢钱。主要是黑客们摒弃了前些年急着去苹果商城充值套现的方法,而是选择一点一点的把你的数据卖掉赚长线的钱……毕竟,这样就鲜少会有人报警,也鲜少会有人追责到底了。在黑客圈子里,这个叫 APT(Advanced Persistent Threat,长期高级威胁)攻击——比如做一种毫无症状的病毒到处感染,只为通过某个银行高管的个人设备入侵到银行内网。或者是《三体》里那个只对面壁人致命的流感病毒,也是这个原理。毕竟,不产生直接损失我们普通人就当是没发生过。那我还能说什么呢,我们一起听首歌吧:本文由百家号作者上传并发布,百家号仅提供信息发布平台。文章仅代表作者个人观点,不代表百度立场。未经作者许可,不得转载。PingWest品玩百家号最近更新:简介:有品好玩的科技,一切与你有关作者最新文章相关文章注册 | 登录
简书:朱利安(持续输出高质量文章)/移动医疗产品经理/死磕精神
从零开始学运营,10年经验运营总监亲授,2天线下集训+1年在线学习,做个有竞争力的运营人。
本文作者将介绍一种通过分析用户产生的内容了解用户最近关注的内容,最终帮助改善产品的方法。
网上流传着张小龙的对于乔老爷的一段评价:
乔布斯最厉害的地方是什么?他说乔布斯1秒钟就能变成白痴,这是他最厉害的地方。那马化腾呢?他大概需要5秒钟。而我差不多需要10秒钟。
这里的“白痴”并非字面意思,而是指产品经理在使用产品,构思产品功能的时候,能抛弃掉自己固有的思维身份,用同理心将自己转变为一个产品的典型用户,站在用户的角度去思考问题,而且能够在多种不同的用户角色之间进行切换。
外人看来好似十分简单,然而真正有过产品工作经验的人都知道,要抛弃掉自己过往的思维习惯,将自己转化为一个用户是多么的困难!
更多的时候我们通过场景分析,来假设自己是产品在某个场景下的特定用户,或通过用户画像来使得用户轮廓清晰起来,但也很难做到短时间内将自己转化为一个用户,真正以用户的思维去体验和思考产品。
“白痴”不易,但用户在想什么还是要知道啊?
怎么办!?
How to do?
常见了解用户的方法有用户调研,用户访谈,用户研究等等
除此之外,常见的还有一种——数据分析,通过数据分析来揣摩用户的心里,猜测用户的需求。
本文要介绍的数据分析和提前在功能上线前埋点,再分析埋点数据来辅助产品决策有所不同。
这类的数据通常是用户产生的内容,没办法直接获取可用的量化数据,特别有几十万的文本内容数据的时候,面对一大段一大段的文字,根本无从下手。
而仅仅分析内容的平均字数显然意义不大,针对内容本身的分析才更有价值。
下面介绍一种通过分析用户产生的内容了解用户最近关注的内容,最终帮助改善产品的方法。
收集用户的内容数据
提取内容关键词
分析关键词,运用于产品
第一步:收集用户的内容数据
首先,第一步,收集用户数据,但用户哪里来呢?
既然最终是为了改善产品,从群众中来,到群众中去的思路肯定是对的,作为医疗行业的产品经理,举几个医疗行业的例子。
1. 点评数据
有产品的销售可能产生点评,这里的产品不是指单某一款app或商品,而是引用了经济学中对于产品的定义。
产品是指能够供给市场,被人们使用和消费,并能满足人们某种需求的任何东西,包括有形的物品、无形的服务、组织、观念或它们的组合。
医疗行业中医生为病人提供的线下诊疗服务,线上咨询服务,私人医生服务等等就是一系列的产品。(这里没有贬低医疗从业人员的意思,仅仅是从字面意义上进行解释)
当用户使用完这类产品的时候,会对产品进行评价,例如线上挂号,线下诊疗后对医生的态度,诊疗效果进行评价,供其他用户进行参考。
这类点评内容数据可以供其他用户在购买该产品前能有参考的凭据,同时产品人员可以利用点评的好评中评差评等数值的数据来优化列表的排序,让更多优质的医生得到曝光。
2. 咨询数据
方才提及的医疗行业的产品中,线上咨询服务不仅仅会产生点评的内容数据,还会产生真实的医生和患者之间一对一的交流的内容数据。
这些内容数据在一些较大的互联网医疗公司的产品中会通过一定的隐私处理后对公众开放,例如在PC端百度搜索“喉咙痛吃什么好”会出来非常多相关的咨询记录,包括39健康网,快速问医生等知名医疗网站的数据。
这类咨询内容的记录能帮助一些遇到相同问题的用户更快的解答自己的疑惑,提高产品内容的丰富度,增加用户粘性。
另一方面,公开这类数据让百度,360等搜索引擎的爬虫抓取,有助于提高网站的权重,在用户搜索相关内容的时候更容易出现在靠前的结果,相当于给平台新增了流量来源。
3. 社区医患双方的讨论数据
医疗行业的社区也会产生内容数据,患者和患者针对某个疾病进行讨论或分享自己的治病经历,医生和医生针对某些疑难杂症进行讨论,医生给患者进行科普的健教类文章而引起的医患双方的互动等等。
例如在PC端,糖尿病垂直社区的“甜蜜家园”以及微医的“医言堂”等,虽然一直对微医的“医言堂”模式抱有怀疑的态度,但不可否认,医患双方也是会产生一些社区讨论的内容数据。
如何获取数据?
类似上述这类的内容型数据,该如何获取?
最简单直接的方法就是找研发哥哥直接导数据,或提个后台需求,自己导出到Excel表格查看。
但有些时候,自己的产品本身数据量不大或没有数据,或本身没有后台且只是想导出小部分进行分析怎么办?
那就用“爬虫”呗,自家产品没有数据,就去爬竞品的数据;自家有但不好意思老是麻烦开发,那自己爬一些需要的数据分析。
作为产品经理,本身也不会写爬虫代码,怎么办?
这里介绍一款软件——“八爪鱼采集器”,即使不会写代码,也能快速的获取自己想要的数据!(这软件也是平时没事逛简书,在的文章中发现的,强烈安利)
通过八爪鱼和一些公开数据,我们就能获取到针对单个疾病的咨询内容的数据,这样我们就能分析用户在某类疾病下普遍会去咨询医生的内容是什么。
再举个栗子,每周周五的时候,经常对着咨询数据的周报发愣——这周数据为何变动怎么大?大涨或大跌了,发生了什么事情??
这时候通过八爪鱼去爬一些异常波动科室最近2-3天的数据,或指定某天波动特别明显的数据,这样就能知道用户在这段异常波动期间哪些咨询内容成为了热点?例如流感在咨询的内容中被提及的次数多了,我们就能知道最近流感高峰期来了。
第二步:提取内容关键词
回顾下我们的三个步骤:
收集用户的内容数据
提取内容关键词
分析关键词,运用于产品
在第一步的收集用户内容数据中,我通过采集数据的软件收集了用户在某天的咨询问题,共15859条。
通过第一步抓取用户的数据,成功获得
《带有大量文本内容的数据表格》 X1
仅将其中的咨询内容单独拎出,就已经有130W字的内容数据。
但是这些内容数据长短不一且数据量并不小,问的问题也不尽相同,例如:
“片子是术前的还是术后复查的。术前膝关节是什么症状?目前膝外侧是痛还是肿?偶发的还是一直持续的?”
“谢谢主任的讲解,那到底现在能不能做手术呢?毕竟是肿瘤也不能拖。”
“孩子年龄很小,夜里踢被子很容易胃部受凉而出现上述症状!建议多喝白开水、、少吃多餐、肚脐贴,必要时去医院看看”
如果仅仅针对一个句子一个句子进行分析,不单没法量化,而且需要花费大量的时间,咋办?
一句一句分析的办法肯定行不通,这时候就要祭出提取关键词大法了。
什么是关键词?
通过关键词提取软件,将上述的大段文本切成不同的词汇,再找出关键词,将关键词按照词频和权重进行排序,就知道哪些词汇是用户提及最多,最重要的。
这里可能要问,什么是关键词?
高中时候我们都作过阅读理解,关键词就是在一篇阅读理解中反复出现或比较重要的词汇。
这里我们有两个概念:
词频,用来描述出现的次数;
权重,用来表示这个词汇的重要程度。
例如“片子是术前的还是术后复查的。术前膝关节是什么症状?目前膝外侧是痛还是肿?偶发的还是一直持续的?”,切词之后就变成“片子,是,术前,还是,术后,复查…”
“术前”的词频为2,因为它出现了两次,但是“术前”词汇的权重呢?这里无法直接给出,但是在统计学上,越常词汇的权重就越小,例如“我,你,他”,同理,不常见的词汇,例如“肿瘤”,权重就会较大。
不同词汇在不同的语境下的重要程度是不同的,假如一篇专门讲述手术的文章,和一篇专门讲述糖尿病的文章都有提及“糖尿病”这个词汇,词汇“糖尿病”明显对于讲述糖尿病的文章是更重要的,但是词汇“糖尿病”在不同的文章中的权重又相同。
这时候如何突出关键词“糖尿病”词汇对于糖尿病文章的重要性呢?
为了思考这个问题,逛了逛知乎,在上面看到了一种关键词提取的理论——TF-IDF法
TF-IDF=词频(TF)*逆文档频率(IDF)
原理这里不展开讲,我们可以简单粗暴的理解为一个关键词的重要程度可以这样判断
关键词重要程度=词频*权重
提取关键词的方法理论比较复杂,但我们不需要了解背后的机制,使用一些切词软件就能帮我们提取出大段内容的关键词,而且还含有词频和权重(至于这些切词软件是否使用的是TD-IDF的理论不得而知,暂且认为是吧。)
这样,通过切词软件,我们终于从一堆长长的文本中提取出了关键词。
得到 《带有词频及权重的关键词表格》 X1
导出Excel表格将关键词的词频和权重分数相乘再倒序排列,这样我们能知道哪些词汇是出现频率高且权重大的关键词。
第三步:分析关键词,运用于产品
经过前面两步,我们手中已经有了
《带有大量文本内容的数据表格》 X1
《带有词频及权重的关键词表格》 X1
对着这两个表格,我们能做些什么?
先说个题外话,前阵子有位仁兄抓取了大量民谣的歌词,统计了歌词中常出现的词汇,同时使用了腾讯文智和哈工大社会计算与信息检索研究中心的自然语言处理模块,对这些词汇的感情色彩进行分析。
得出了如下结论:
在我的统计中,出现最多的几个意象是:再见,姑娘,夜空,孤独,快乐。
如果把民谣拟人化,那应该是一个喜欢南方的北京小伙子,觉得世界很操蛋,但骂归骂,到底是对生活有希望的,憧憬着明天,在春天感到快乐,在冬天感到孤独,没有女朋友,但有几个纠缠不清的前女友,经常和她们见面,见面的地方可能是成都,昆明,南京,上海,武汉。
也许你认为这些关键词最大的用户无非就是写篇文章,博众人一笑,成为闲暇的谈资,那就错了!
既然这些关键词从真实的用户中来,那么通过关键词也能了解用户在想什么,也能用于产品中,例如运用于点评,咨询,文章,内容推荐等等。
关键词的运用场景
如果内容数据从点评中来,那么可以筛选出好评,中评,差评的内容,分别提取出对应评价的关键词。
在产品功能上,提供点评的便捷输入的标签,而标签的内容,就可以是用户常常使用的词汇(既你提取出的关键词)。
提供这些便捷输入能提升点评的体验,也能促使用户点评,提高总体的点评量。
一篇好文章最怕的是没有阅读量,但单单靠标题党绝对不是长久之计,真正从内容下功夫才是王道。
在对的场景中将用户感兴趣的文章推荐给他是提升阅读量的有效方法。
以医疗举例,在皮肤科的专题页面中,通过分析皮肤科用户的咨询数据,了解用户最常咨询的关键词是“湿疹”、“皮疹”、“皮炎”、“皮损”等等,那么文章的选题就可以从这些用户常咨询的关键词入手来展开。
3. 咨询主诉内容的填写
通过分析咨询内容,在用户填写自己病情的时候,显示出来对应的关键词标签,让用户点击快速输入,减少用户手动输入的内容。
既能帮助用户实现更高效的输入方式,同时通过标签的提醒,也能提醒用户自己是否存在同样的症状,在描述症状是更加的仔细,提高咨询填写主诉的质量。
4. 建立疾病和对应的同义词库
脑洞再大的时候(这里可能不科学,纯属脑洞),我们去分析某个疾病下用户的关键词是什么,将这些描述症状的关键词设为疾病的同义词,让两者建立关联关系。
这样做的好处在于,让用户在搜索某个疾病的症状的时候,例如牙疼,那么就能通过这些描述症状的关键词去找到对应的疾病名,提示用户可能的疾病是什么,提高搜索的准度。
最后:三步骤总结
至此,通过三步骤:
(1) 收集用户的内容数据,我们获得了
《带有大量文本内容的数据表格》 X1
(2)通过提取内容关键词,我们获得了
《带有词频及权重的关键词表格》 X1
(3)通过分析关键词,运用于产品,我们可能会获得
点评功能 X 数据上涨 ↑
资讯功能 X 数据上涨 ↑
咨询功能 X 数据上涨 ↑
搜索功能 X 数据上涨 ↑
关键词运用的场景还能有很多,可以慢慢挖掘,欢迎交流。
本文由 @朱利安 原创发布于人人都是产品经理。未经许可,禁止转载。
赞赏是对原创者的最大认可
赞赏6人打赏
收藏已收藏 | 149赞已赞 | 31
简书:朱利安(持续输出高质量文章)/移动医疗产品经理/死磕精神
产品经理群
运营交流群
品牌营销群
文案交流群
Axure交流群
关注微信公众号
大家都在问
4个回答10人关注
11个回答12人关注
2个回答5人关注
8个回答8人关注
9个回答13人关注
15个回答16人关注

我要回帖

更多关于 管理用户地址APP 的文章

 

随机推荐