这两天在公司没什么正事做。可能是因为要走了的原因吧,师傅只是很敷衍的安排了个分析方案的项目。
不过讲真,要真的想做事还是有一堆事可以做的,但是我确实对这家公司有点失望,自己本身也不想去找事情做。
上午练习了很长时间的打字(对,你没看错,就是打字~~), 下午突然想起来很早以前一直想玩的一个东西——MMD。这么多空闲时间,不正好是试试新东西的好时候么!
于是从网上下载了汉化的安装包,整个过程真的非常顺畅,一路下一步就完成了安装。
打开界面看了一下,发现上手曲线很平滑,如果之前用过谷歌的草图大师,那应该很快就可以开始愉快地玩耍了。
大概点开所有的菜单看了一下,发现这个软件还是很有深度的。一个9.8M的安装包可以做到这些确实很厉害,霓虹国人在这种奇奇怪怪的地方果然还是很有一手的。
操作过程大同小异,但可以看出作者为了让各种人群都可以享受到这个游戏的乐趣,做了很多的工作,界面很简约,操作起来很舒服。
另外我在安装的时候还发现这个软件自带了一个AR的软件包。要是可以自己做一套初音的舞蹈包那一定非常的不错。想想现在身边也搞不到AR眼镜,最后还是没有安装这个扩展包。
下面是自己随便搞得一个截图:
终末之诗(The End)
赢了鼓掌 输了抬头 这才是比赛
和谐图片检查工具
这两天宝宝确实有点高产啊~~
其实讲真,为了搞这些东西,宝宝公司里的活都暂时搁浅了。
本程序根据颜色(肤色)找出图片中皮肤的区域,然后通过一些条件判断是否为色情和谐图片
程序的关键步骤如下:
- 遍历每个像素,检测像素颜色是否为肤色
- 将相邻的肤色像素归为一个皮肤区域,得到若干个皮肤区域
- 剔除像素数量极少的皮肤区域
我们定义非色情和谐图片的判定规则如下(满足任意一个判定为真):
- 皮肤区域的个数小于 3 个
- 皮肤区域的像素与图像所有像素的比值小于 15%
- 最大皮肤区域小于总皮肤面积的 45%
- 皮肤区域数量超过60个
当然,这个算法一看就知道不可能具有100%的精确度。而且由于图片越大,像素点就越多,这样我们想要识别一张照片就会变得很慢。我觉得这种算法的优势就是速度,如果不能在速度方面对人工识别产生维度打击,那这个算法就失去优势了。毕竟人类在这方面有着只可意会不可言传的优势。。。
既然这个东西貌似没有什么卵用,那为啥还要开发他呢?
亲们记不记得我还有40多个G的妹子照片需要分类。我需要过滤掉那些玷污宝宝眼睛的照片,然后把它们全部放到一个叫做“不要看”的Folder里面去啊!这么光荣的一个任务,当然需要这个神奇的东东出马啊。
各位千万别说我low,我又不是搞神经网络的,不会没事搞个什么152层的人工智能算法出来(理论上来说,我搞过一个40W维的~ ~)。再说也不是办什么正事,能凑活着用就可以啦。
最后,宝宝午后优雅测试了一下。配合协程,效果拔群 ~。~
代码什么的还在完善,等完成之后会发出来的(对,宝宝就是不想给~。~)
高可匿代理获取工具
这几天写爬虫写的很疯狂,毕竟妹子对于我还是有很大吸引力的嘛~
在爬虫运行的阶段,我喜闻乐见的遭遇了反爬虫机制的阻击。于是经过一番较量,我先后伪造了Header,使用Selenium去Driver请求,用PhantomJs去渲染Response。但这一切都没有逃过反爬虫机制的法眼。在反反爬虫无数次之后,宝宝痛定思痛决定想一个长久的对策出来。
想想怎么样才能彻底不让反爬虫机制抓到?当然是把请求分散到不同的ip,然后多线程渲染啦。
然后问题就又来了,我上哪搞这么多代理ip去?
于是乱刀 v0.1版本应运而生,这个工具可以为我源源不断的提供高可匿的代理ip,这样我就可以愉快的爬取妹子的照片了,啦啦啦~~~
由于luandao的定位是辅助工具,所以我貌似只需要编译一个pyc出来就可以了。当然,你要是想单纯的获取一下代理地址,我这里也是支持的。
luandao的Github地址:
https://github.com/Elfsong/WintersWrath/blob/master/python/luandao.pyc
PDF文件合并工具
这个工具是很早之前写的。
当时还在学习PyQt,整体的技术都很不成熟。比如说文件的路径就不支持工具外搜索,这点在现在看起来很容易实现,但是当时我真的是已经尽力了,才实现了那个简单的功能。还有当时用的是Py2exe生成的执行文件,由于了解不够,没有能够生成单独可执行的exe文件,必须依赖一些dll才能够运行,这样为了安装方便,我不得不将功能打成安装包。
本来这就是一个用来练手的项目,写完以后挂在网上也就没有在去在意了。但是今天投Google内推的时候需要将原先的中英两份简历合并,原始的Doc又暂时取不到,只好重新下载自己写的这个工具,很优雅的搞定了这个事情。
现在再看自己之前写的工具,有种特殊的感觉。既可以感受到当时的青涩,也可以体会到当时的雄心壮志。总之,是种很不错的感觉。
这个工具还是蛮实用的,很多时候我们都会遇到将pdf合并的工作。唯一的缺点就是需要安装才可以使用,按理来说实现这种小功能的程序越绿色就越好的。BTW,这个工具卸载绝对无残留,运行一下Uninstall.exe就可以卸载掉了。
下面是setup的下载地址(本来想用百度云的,但是公司网络屏蔽上传不了。为了图省事,就先放自己服务器上了):
ftp://119.29.67.39/Pdf_Merge.exe
亲爱的,这是你在阿里的第24天,享受你的这一天!
阿里巴巴一度是我非常崇拜的一家公司,为了芝麻开门我放弃了腾讯的TST。但来了之后的体验,确实令人很失望。
首先,你时时刻刻是被打上实习生标签的。领电脑的时候被告知只能使用一台19寸,用了6年的显示屏。不仅颜色发黄,eclipse开了Debug之后能看到的代码只有六七行,妈的还调试鬼的代码啊!我很确定我现在眼睛疼是这个劣质显示器造成的。
总之,阿里真的是一座围城,外面的人想进来,里面的人想出去。
———————————————— 2016.11.24 —————————————————
阿里对于我来说是个不大不小的转折点。
我承认我对阿里的怨念不浅,但我也承认阿里是一家很伟大的公司。这里的伟大或许会超出我们自身的价值观。他剥削我们的劳动力、垄断着市场、还不停的卖假货,这是与我们自身利益背道而驰的,我曾经一度诋毁着阿里的一切。
后来我明白了一件事,其实最不明智的行为就是用别人的错误去惩罚自己。阿里有着种种不是,但不可置否的是,他创造了全世界最大最棒的电商平台,以及无数的第一。
在经历了阿里之后,我选择了出国读研。原因很简单,我对工作产生了莫名的恐惧。我把这一切都归因给了阿里,其实这是不对的。我总有一天会去工作,我在阿里所经历的一切还是会如期而至的,这似乎是自由与必然的鬼畜辩证关系。
总之人是在不断成长的,现在看到自己之前狂黑阿里觉得有些好笑了。人生是自己走自己的路,何必那么在意一个匆匆过客呢?
最重要的是,我还有那么多大好青春可以去挥霍!
于无声处听惊雷
在阿里的实习让我感受到了真正”所谓大公司”的风格。写代码之前需要制定详细的文档,每一步的情况都要考虑到,之后的编码工作根据文档按部就班的执行。
我不得不承认,这种方法确实可以让问题变得更少,代码更容易被维护,有着无数的优点。但是请原谅我只能称之为编码,而并不是编程。
真正的编程应该是充满创意的,应该是天马行空的,是不该被条条框框所束缚的。我走在公司,看到一个个为了工作疲于奔命的人,他们用这是自己的梦想支持走着,也许这就是现实。
我认为如果一家互联网公司为了一致性而只能使用一种开发语言,为了一致性连代码格式都要控制,那么也许他现在可以走的很好,但终究不会长远。这种地方,我想我也不会久留。
所以,每当我熟悉了一个地方,也就意味着我离离开那里也不远了。
风林火山
今天去东厂转了一圈,走了很多路,外面又热,真的感觉有点累。
不过辛亏没有被电脑,要是带上那个重装备,非得给累死不可。从东厂出来和作冲以前回了恒生的宿舍,我之前也住过,很有感觉。
这两天仔细想了一下自己的发展方向,还是先出国吧,所以实习结束又要告别了。
也许这是很久之前就学会的保护方法,对于预知很快就要告别的人,我不会敞开心扉。这样确实可以不让自己受伤,但是也让我失去了很多东西。事情总是有利有弊,现在觉得一切随缘就好。当初能去腾讯,能进阿里我觉得都是非常机缘巧合的事情。我在这些公司学到了很多以前闻所未闻的东西,确实很有帮助。但同时我也可以感觉到这不会是我最终的归宿,我并不适合这种大公司的环境。既然都是生命中的过客,点到为止就好。
又要到周末了
又要到周末了。
这次实习确实随意了很多,大概是因为没有打算留下来,抱着玩的心态。
要是以前现在应该会是考虑周末还有哪些需求需要搞一下,
现在已经变成了戴着耳机码着字,脑子里想着周末这两天要去东厂玩,
去延安路吃什么的事情了。
我发现以前自己总是犹豫不决的原因真的是因为选择太多了,
适当的自断退路也许是好的,破釜沉舟总能在你想后退的时候狠狠地推上你一把。
下学期真的是要专心的做事了,也算是补我之前欠下的账吧。该还的总是要还的。
出国确实可以很好的开阔视野,学到很多在国内学不到的知识。
现在既然只剩下了这条路,那就拼命的走下去吧。
另外,今天捉鱼同志给我发信息说他要去成都了。我一开始还以为是他想炫耀一下去找妹子玩,结果这家伙居然直接转岗去mig了。爱情的力量果然是伟大的,我大写的服啊。
不过我大成都确实风水不错,好吃的又多,陷入深深的羡慕中无法自拔~.~