谁能分享下百度云岛国片子群分享的片子不?

后使用快捷导航没有帐号?
【技术分享】百度云是如何识别出A片的?
[color=rgba(0, 0, 0, 0.8)]如今网盘行业已经倒得差不多了,只剩下360云盘,百度云,华为云盘等等,而百度云里面大部分的XX影片都不能看了(不要问我是怎么知道的)百度云是如何识别出这类电影的呢?下面把话筒转向知乎大神↓[color=rgba(0, 0, 0, 0.8)]————————————————–步骤1:数学筛选——————————————————–
[color=rgba(0, 0, 0, 0.8)]首先把百度云上的视频采样分析。例如每个片子截取100张图片,然后自动分析图片内容。
值得注意的是,自动分析黄片内容不是不可能的,例如:
9cc2b34ed15d_b.png (47.45 KB, 次数: 10)
20:29 上传
[color=rgba(0, 0, 0, 0.8)]使用颜色特征分析来测量图片中皮肤的面积。。。然后确定是不是黄片。
[color=rgba(0, 0, 0, 0.8)]我听说黄片中的人物一般都不穿衣服,所以整部片子中皮肤面积会占屏幕比重比较大,特征明显。
[color=rgba(0, 0, 0, 0.8)]不过我是好孩子所以也不清楚到底是不是真的。
4d1ac1d2db_b.png (80.13 KB, 下载次数: 7)
20:29 上传
[color=rgba(0, 0, 0, 0.8)]然后用一些算法进行评分处理。。例如:
ef30bc6adff_b.png (78.34 KB, 下载次数: 3)
20:38 上传
[color=rgba(0, 0, 0, 0.8)]通过皮肤的位置和分布分析是不是黄片儿:
71b87ccd18e046beaa06_b.png (118.16 KB, 下载次数: 4)
20:38 上传
[color=rgba(0, 0, 0, 0.8)]把图片特征量化,通过这些量化的数据进一步分析做到黄片的筛选。
[color=rgba(0, 0, 0, 0.8)]
[color=rgba(0, 0, 0, 0.8)]————————————————–步骤2:玄学筛选——————————————————–
[color=rgba(0, 0, 0, 0.8)]光通过数据分析不可能做到完美筛选全部黄片,但是本着宁可错杀一千不能放过一部的原则,我们可以通过实践(改变通过的变量)肯定找到一个能筛选出所有黄片的算法。这个算法可能误杀大量正(绅)常(士)视频,但是也能排除绝大多数非黄片。[color=rgba(0, 0, 0, 0.8)]剩下来的糟粕可以进一步用机器学习来筛选。。
例如某同学的硕士毕业论文:
bbb8b29ddae1a_b.png (17.74 KB, 下载次数: 11)
21:50 上传
[color=rgba(0, 0, 0, 0.8)]当然,也可以跳过第一步直接上第二步,如果计算能力和精确度都不是问题的话。[color=rgba(0, 0, 0, 0.8)]————————————————–步骤3:人工筛选——————————————————–[color=rgba(0, 0, 0, 0.8)]最后剩下的交给他审核一下。。。[color=rgba(0, 0, 0, 0.8)]
9ebe3a174f50c3bcbe31_b-1.png (104.58 KB, 下载次数: 15)
21:50 上传
[color=rgba(0, 0, 0, 0.8)]————————————————步骤4:举报机制——————————————————–人人都是小小鉴黄师
比如这类AV。。。
就需要各位小鉴黄师们的努力了。
211a3b508c35dbfa2fcbed_b.png (192.42 KB, 下载次数: 10)
21:57 上传
[color=rgba(0, 0, 0, 0.8)]当然,还有一种更神奇的方法。。检测音频中的叫床声。
初入龙坛, 积分 1539, 距离下一级还需 -1519 积分
初入龙坛, 积分 1539, 距离下一级还需 -1519 积分
anchangxin 发表于
全特么,主要是检测文件大小
知道什么叫MD5吗?&&通过已知的文件md5进行拦截就能做到屏蔽,但是弊端还是很大,通过修改文件的md5就能复活了,关文件大小没啥事。所有网盘都这么干的,还有关于“秒传”就是说,你一个10GB大的文件,一秒就上传完毕了,这也是通过md5来实现的,网盘上传时扫描
你文件的md5对比已经存在网盘上的数据,如果如果一致,就从服务器存在的文件复制一份给你。
龙坛新贵, 积分 172, 距离下一级还需 -72 积分
龙坛新贵, 积分 172, 距离下一级还需 -72 积分
其实天线宝宝也会被百度净网,不信试一试
初入龙坛, 积分 118, 距离下一级还需 -98 积分
初入龙坛, 积分 118, 距离下一级还需 -98 积分
是个鸡鸡我百度云里一堆片没一个给测到
我怎么回被封&
发表于 3&天前
加我QQ私聊&
<font color="# 发表于
知道什么叫MD5吗?&&通过已知的文件md5进行拦截就能做到屏蔽,但是弊端还是很大,通过修改文件的md5就能 ...
赞哦!但是改文件大小不是最有效的嘛?,嘿嘿,我知道那个什么md5,还有sha1,crc32。
龙坛新贵, 积分 1736, 距离下一级还需 -1636 积分
龙坛新贵, 积分 1736, 距离下一级还需 -1636 积分
全部替换教育片。。。。。。
发表于 6&天前
龙坛新贵, 积分 48, 距离下一级还需 52 积分
龙坛新贵, 积分 48, 距离下一级还需 52 积分
用ES文件浏览器压缩后改扩展名就行了,比如一个文件123.apk压缩后得到123.apk.zip修改扩展名为123.apk.minecraft再上传就行了
全特么,主要是检测文件大小
龙坛使者, 积分 3078, 距离下一级还需 -2578 积分
龙坛使者, 积分 3078, 距离下一级还需 -2578 积分
(1.92 KB, 下载次数: 31)
14:05 上传
龙坛使者, 积分 676, 距离下一级还需 -176 积分
龙坛使者, 积分 676, 距离下一级还需 -176 积分
奖品:小米5,电视电脑盒子,永久年套餐
送无线键鼠
秀桌面,赢积分
1.2.3.4.5.6.7.8.9.10.
咨询热线&&400-066-0062
联系邮箱&&
&&&. All rights reserved. (系统公告 - [易索论坛 Powered by ISSO]
论坛数据库例行维护,感谢大家的支持,稍后会恢复正常访问。百度云是如何识别出 A 片的?
百度云里面大部分的XX影片都不能看了(不要问我是怎么知道的)百度云是如何识别出这类电影的。
129 个回答
这个只看重召回率(宁可错杀一万不要放过一个)的话,图像识别的技术已经可以做到不错了。根据每一帧里面的图像抽取特征,然后跑个分类器就好了。Porn这种模式单一,重点突出,机位固定,然后人体各个部位pattern又那么明显,相信只要有足够的训练数据,并不是一个特别难的机器学习问题。当然你硬要拍两个奥特曼高达穿着盔甲干啥啥,估计不太好识别= = 但是人观众也是为了简单的刺激,你硬搞这么深奥的想必市场不怎么样吧?误杀一般都是加菲猫之类的....毕竟全身都是黄的。具体百度网盘是怎么做的,我猜是机器学习+MD5识别。如果我来干这个的话,先按照经典的方法做一个模型出来,特征就是视频图像识别的特征+文件名文本特征+文件格式,大小等特征。模型拿个常见分类器就行了。估计音频特征也可以,porn的音频特点也很明确(日语 or 英语那些词太明显了),一抓一个准。继续丧心病狂的话就加视频特征。连续多帧里面人数量的变化啦(人数量相对固定,大都是一到两个,三四个也有,再多就不是那么常见了);人物移动的pattern啦(很少大范围的移动,而更多是小范围的往复运动);发生的场景啦(大都是室内小空间,并连续很多分钟都是一个场景啦,偶尔有一些外景)。不过我觉得完全不需要这么复杂就可以做到很高的准确率了......有模型之后,每隔一天或者几天,具体根据模型效率和机器的负载来决定,在网盘的图片和视频数据上跑一遍,把不该有的东西干掉,然后记录下MD5码。 这些MD5码就是黑名单了,往后每次用户新上传的时候就用这个MD5码做一次判断,不该有的就不让你传了。就是一次哈希查找,效率很快,根据百度网盘本身极速上传功能推断,百度已经有了很成熟的MD5操作的模块了。这两个加起来就既满足了效果(靠机器学习模型每隔一段时间的精确判断),也满足了效率(MD5实时校验)。所以呢,你们不要以为改了MD5码就可以逃得过去了,过一段时间人家重跑自动识别算法时还是会被干掉的...这种内容我党管的那么严,搞不好部门领导就要被喊去喝茶的,不可能不好好做的...---------------------------------------闲扯的分割线--------------------------------色情内容识别是一个很认真的研究领域好咩。不过...干这个确实需要大量的训练数据。当年中科院计算所有一个组在做这方面的国家项目,黄色+反动内容识别。人家都是带着条子和公款去国外采购影片和轮子的东东回来做训练数据的......我不懂事的时候有个女朋友花钱太厉害,逼的没办法去一家前著名论坛网站打零工做过类似项目,不过是自动识别黄色/反动的文本...... 他们有积累了很久的人工识别的数据。招了不少人做类似鉴黄师的工作,三班倒每班连干八小时,拿一个简单的搜索引擎对用户发布的内容不停地用各种关键词搜,看到不该看的就删帖+搜集起来。然后这些人工识别的数据拿来给我们训练自动识别模型。当时为了提高识别效果我被迫看了好多训练数据。。。。。。我只能说......太刺激了....太暴力了....太有想象力了......我原先只知道有黄色的,有反动的,没想到还有黄色+反动的........你能想象拿四人帮做主角的XX小说么........看起来真是一种复杂的感受....类似比利时啤酒,无数种强烈风味的混合,造成了独特的饮用体验...总之,这对于纯洁的我实在是太下流了....一张白纸的我就这么被污染了...再也回不去了......喂,你们不要误会,我那个工作是做模型自动识别来着,不是人工看好么。。。而且也只是那半年工作很小的一部分。。。大部分时间还是在给他们做站内搜索和开发公司自己的基础C++库来着。人工谁要干啊,估计时薪只有十块钱,还要看那么多好恶心的东西...黄瓜茄子一看就会想呕怎么办......
没错,就是根据md5值,因为我改掉md5值之后还没有一部被温馨提示。改完md5值后上传的视频不会温馨提示,具体方法看这个链接。直接把要修改的文件拖到下载的批处理文件上就行。评论里有好多问各种问题的,其实我也是外行。如果已经温馨提示了,那应该就没救了。我用软件打开看过,除了那8秒温馨提示,其他部分的二进制数据基本都是0了,也就是说真的没东西了(刚开始和谐的时候,温馨提示的文件里内容还在,现在真没了)。这个问题我觉得没法解决了,要是有办法大神可以教我。修改md5值之后上传肯定不能秒传,目前我还没发现被和谐,以后不好说,但是应该不会太严重。评论还有说转格式的、压缩文件,应该都是可以的,因为md5也变了;单纯改后缀应该不行。貌似说了多余的话,被建议修改了。所以求分享的你们别闹了,我这么纯洁,根本听不懂你们在说啥。。
百度云怎么识别不知道,但是曾经听前Google XLab某Scientist讲段子说过youtube怎么识别黄色视频的。Youtube每天上传的视频量估计比百度云一个月都多,他们有一个专门的大团队来鉴黄。当年他们也和各位其他答主一样,认为高大上计算机视觉是可以解决这个问题的,于是乎他们花了大量的时间和金钱使用了各种高大上的算法在视频里面检测裸体,什么颜色啦,动作啦,人脸,器官识别啦。几个月过去了,然而并没有什么卵用。两大问题,一是速度太慢。二是准确度还是太低。后来有个神哥们临危受命加入这个组,万万没想到,这个问题被他解决了。后来这哥们在google research混的风生水起。你知道他是怎么解决的吗?只检测音频中的叫床声。
Md5是必杀技,但是对于百度这家广告公司来说,行为统计分析才是拿手好戏,下载量时间分布,在线播放快进频率,文件命名规则,跳转到网盘之前的搜索行为,再对接网友举报,av数据库,离线下载来源分析,根本就不需要人工审核,可疑概率小于一定值的百度直接放过。(乱猜的)
我来提一套可能的半自动方案,当然现实中是怎么运作的我就不清楚了。--------------------------------------------------步骤1:数学筛选--------------------------------------------------------首先把百度云上的视频采样分析。例如每个片子截取100张图片,然后自动分析图片内容。值得注意的是,自动分析黄片内容不是不可能的,例如:使用颜色特征分析来测量图片中皮肤的面积。。。然后确定是不是黄片。使用颜色特征分析来测量图片中皮肤的面积。。。然后确定是不是黄片。我听说黄片中的人物一般都不穿衣服,所以整部片子中皮肤面积会占屏幕比重比较大,特征明显。不过我是好孩子所以也不清楚到底是不是真的。然后用一些算法进行评分处理。。例如:通过皮肤的位置和分布分析是不是黄片儿:这些数学算法能把图片特征量化,通过这些量化的数据进一步分析做到黄片的筛选。--------------------------------------------------步骤2:玄学筛选--------------------------------------------------------光通过数据分析不可能做到完美筛选全部黄片,但是本着宁可错杀一千不能放过一部的原则,我们可以通过实践(改变通过的变量)肯定找到一个能筛选出所有黄片的算法。这个算法可能误杀大量正(绅)常(士)视频,但是也能排除绝大多数非黄片。剩下来的糟粕可以进一步用机器学习来筛选。。例如某同学的硕士毕业论文:当然,也可以跳过第一步直接上第二部,如果计算能力和精确度都不是问题的话。--------------------------------------------------步骤3:人工筛选--------------------------------------------------------最后剩下的交给他审核一下。。。------------------------------------------------步骤4:举报机制--------------------------------------------------------人人都是小小鉴黄师比如这类AV。。。就需要各位小鉴黄师们的努力了。
我猜测是爬各大色情网站或种子网站里 porn 分类里 A 片的,然后保存 hash 值到一个数据库。
我倒是觉得这是从视频文件本身入手的,例如,我网盘里的视频,MP4格式的基本都挂了,rmvb小半挂了,rm文件没有挂,mov挂了,mpg没挂,flv没挂~~~~泥蒙懂的,就算你点赞我也不会给你们的!请勿私信!
目前有一套技术方案,可以对视频的某些时间段通过图像识别技术来判断是否属于成人内容。图像识别这方面应该是有相应的成熟的算法,可能会误判,但具体的就不清楚了(当然也不排除直接逐帧进行判断,不过这样可能会增加负荷)。这个技术我给你通俗解释一下,就是用程序把视频的一些片段截取成图片,然后通过程序来判断这些图片的内容是否符合程序的判断规则。再通俗一点儿,就是把原来给鉴黄师干的活儿给自动化、系统化了。当然以上都是我的猜测,具体的实现方法我不清楚……而且我很怀疑百度是否是使用的这一套方案……所以暂且存疑吧。。。当然据我的观察,其实这个方案有很大的漏洞,而且你们在实际使用过程中应该也会发现,有一部分 A 片不会被干掉,原因就是这些视频没有识别出来。PS.据说这套方案貌似是清华大学还是那儿的知名大学的开发组开发的……具体不清楚,建议去一些相对权威的资料网站查查,我也是从公开资料中看到的……出处忘了……
在知乎回答不多,这个问题恰好涉及到最近处理大批网盘资源的问题,顺便讲讲。作为男人,没看过几个AV,确实枉赴尘世一趟(被强帖了标签的哥们,请无视吧。。)看过AV,难免就有要收藏的欲望,藏在硬盘?保密性、快捷性当然无话可说,随点随开,安全无忧,但毕竟真正用电脑点开看av的概率并不非常高,而手机内存又存不了几部av,那么相对来说网盘就恰好解决了这个问题,只要有wifi随时随地戴着耳机倾情观赏磨练。较早的时候,百度云是不管你放什么资源的,即便是你分享av在外面的链接,也是不会删你的。后来随着国家政策影响,严打一步步深入,百度开始利用自身技术发尽威风。不得不说,百度云视频识别技术的确很牛。刚开始改个名,就能免和谐,后来流行什么种子洗白器,稍狠一点的时候在线观看是8秒和谐视频,下载下来还能看,其实那时候是百度云的一个暗示,被和谐的下一步,警惕性高的网友可能会将网盘下下来。果不然,后来下载下来的视频也成了8秒和谐,这就代表网盘存储的av,已经彻底歇菜,表明百度云将服务器里的所有av视频源文件都给替换了,找回是不可能的,除非。。。除非李彦宏也是av热爱者,悄悄的备份了这些海量av。。。。咳,还是不要异想天开了。--言归真正--那么这时候怎么办呢? av还是要看的,网盘还是要传的,如何避免和谐?改md5?非长久之道,后续应该还是可以和谐。 我的应对之策是,将新的av用快速视频截取工具,批量截掉视频头尾的10秒钟(这些内容应该不会影响主要观感。。),如此方法,是防止百度云开发出类似音频文件的音频指纹技术出来,将av源文件的“指纹”跟改到md5的视频比对,进而和谐,这个技术开发出来理论上应该不难。 截掉视频的头尾片段,可以规避掉这个和谐手段。为了长治久安,避免全军覆没的惨剧重演,只有下这狠招了。其次方法,打包压缩加密av,密码可以设置成一样数字加大小字母加特殊符号的,这是最保险的方法,百度云就算再牛逼的服务器,要破解这个文件,cpu全跑,也得8年以上。。。还有略简单的保险手段,用万能文件分割器,将av作为普通文件分割成两个,再这两个文件上传到网盘里,由于无法识别出新的文件格式,在服务器里就像一堆垃圾它们不会动你的,也打不开(要合并分割的文件也用文件分割器合并)。后面两个方法最保险但是也是最繁琐的,当然缺陷也很大,就是不能在线观看。 个人认为第一个方法是最好的。================================================以上是从思路上进行探讨,讨论视频云识别技术和为了改进该技术提出的对抗策略,而非讨论如何防止涉黄内容被查,纯技术讨论,纯技术。。。纯技。。。纯。。。大家看av还是要瞧瞧的看,一个人看,不要传播。最后的告诫:小撸怡情,大撸伤身,强撸灰飞烟灭,各位,悠着点~---------------------------------------------------------------更新:以第一种解决方案在今年5月上传的视频,到目前为止依然正常,可点播可下载----------------------更新:时隔一年,截止,第一种方法依然可以在线播放。
通过MD5也可以识别
已有帐号?
无法登录?
社交帐号登录天气开始慢慢转凉,是时候多去室外走动走动了。不管是秋游,还是逛街难免会无聊无事做...
你是想买对的不选贵的呢还是想买贵的不选对的(笑)?
这款手游为何可以如此顺利地系列化?并且在5年之后推出的新品依旧能得到市场的青睐。
发布会将于当地时间9月7日上午10点正式开幕,北京时间为9月8日(周四)凌晨1点。准备好...
既然以“Pro”为名,机能的进步是至关重要的,尤其是它的 GPU 将要迎来的变化。
没错,就是329美元,只要329美元,其实它是一台“黑苹果”。
苹果logo经历过数次变更,但不变的是苹果对于创新的孜孜追求。
这台“传奇”终于有了个好主人,最重要的是,这位买家家里还拥有另外一台Apple-1藏品...
Tales & Dice AB 推出的《汉娜&亨利-生日会(Hanna & Henri - The Party)》是一款深...
很多爱电子音乐爱到疯狂的朋友们都或多或少的想要制作一首属于自己的乐曲,但纵观如今...
《夜之门》的开发团队是曾经推出过《Last Voyage(最后的航程)》、《Kotoro(探索色...
Wall West 早些时候曾推出过 3 部作品,但是综合质量和可玩性都不高,于是 Wall West ...
虽然这款最早于2012年登陆 App Store 的应用现在来看已经是个一把年纪的“老家伙”了...
《开心农场:热带度假(FarmVille: Tropic Escape)》是 Zynga 推出的一款经营类游戏...
许久未出现在玩家面前的知名益智类游戏开发商《Playrix》最近在粉丝的强烈号召之下终...
Privoro 公司表示,有了这款产品,监听 iPhone 是一件不可能完成的事情。
论数量,Android一直都是第一,但这能说明这个平台统治了移动市场吗?
在Cydia中搜索插件,似乎并不是那么容易让越狱用户感到舒心。
三星也是拼了,不过对Apple Watch的影响好像不会很大。
看起来还不错,这点电量还是可以作为应急用的。
它内置4000mAh锂离子电池,可完整充满Apple Watch多达6次。
小小的一根U8,却可以解决许许多多烦恼,让你的 iPhone,iPad 不再因为“瘦身”而烦恼...
VR ONE Plus,是蔡司第一代虚拟现实头戴设备VR ONE的加强版。
分享一个不要下载播放器,不需要下载 迅雷百度云统统不要的最新电影网站,好用请加分
注册时间 最后登录
在线时间82 小时 UID
主题帖子人气
红苹果, 积分 290, 距离下一级还需 210 积分
网址 唐仁街探案,恶棍天使,师傅,等等基本上刚出来的都高清了
好用请加分
(162.68 KB, 下载次数: 59)
18:26 上传
<p id="rate_96290" onmouseover="showTip(this)" tip="看片加Q万部毛 片百 度 云 A.V资源安全无毒各种类型都有.&人气 + 1
" class="mtn mbn">
<p id="rate_68231" onmouseover="showTip(this)" tip="&a
href=&forum.php?mod=redirect&goto=findpost&ptid=&pid=&fromuid=1&&&span &虽然进入看到的都是地址失效,或者版权问题不存在,各种看不成,还是给你加分,希望把.&/span&&/a&&人气 + 2
" class="mtn mbn">
看片加Q万部毛 片百 度 云 A.V资源安全无毒各种类型都有.
注册时间 最后登录
在线时间298 小时 UID
主题帖子人气
不知道登录上去怎么看,看什么
注册时间 最后登录
在线时间82 小时 UID
主题帖子人气
不需要登录,电影想看什么直接点就能看了回1楼Sjweiphone5s于41 秒前发表的: 不知道登录上去怎么看,看什么......
注册时间 最后登录
在线时间82 小时 UID
主题帖子人气
点击进去。五六秒就好了,解放了不能用flash的尴尬 哈哈哈
(292.2 KB, 下载次数: 28)
18:37 上传
注册时间 最后登录
在线时间266 小时 UID
主题帖子人气
注册时间 最后登录
在线时间82 小时 UID
主题帖子人气
加分啊。点赞也行回4楼qq于1 秒前发表的: 收藏了......
注册时间 最后登录
在线时间82 小时 UID
主题帖子人气
注册时间 最后登录
在线时间1895 小时 UID
主题帖子人气
不知道能用多久,不过这个图片不错⊙▽⊙
注册时间 最后登录
在线时间198 小时 UID
主题帖子人气
注册时间 最后登录
在线时间399 小时 UID
主题帖子人气
要访问的网站包含恶意软件
目前上的攻击程序可能会试图在您的计算机上安装危险程序来窃取或删除您的信息(例如:照片、密码、通讯内容和信用卡信息)。
&&自动向Google报告可能出现的安全事件详情。隐私权政策
吓尿了。。。。。。。。
威锋旗下产品
Hi~我是威威!
沪公网安备 29号 | 沪ICP备号-1
新三板上市公司威锋科技(836555)
增值电信业务经营许可证:
Powered by Discuz!

我要回帖

更多关于 如何在百度云上找片子 的文章

 

随机推荐