昨天考完了DS。
这学期还剩一门DP就结束了,但是今天坐在已经没什么人的图书馆里却没有什么复习的心思。
正逢国内的校招季,身边的朋友们也都开始了自己新的旅程。有大四的朋友毕业去找了工作,有的选择了去国外继续深造。研究生的朋友们要不选择了直博,要不就要加入求职大军。
仔细想想,其实我的机会还是蛮多的,但就是怕不能把握住。希望假期里可以想明白这个事情,然后朝着想去的方向奋斗吧。
昨天考完了DS。
这学期还剩一门DP就结束了,但是今天坐在已经没什么人的图书馆里却没有什么复习的心思。
正逢国内的校招季,身边的朋友们也都开始了自己新的旅程。有大四的朋友毕业去找了工作,有的选择了去国外继续深造。研究生的朋友们要不选择了直博,要不就要加入求职大军。
仔细想想,其实我的机会还是蛮多的,但就是怕不能把握住。希望假期里可以想明白这个事情,然后朝着想去的方向奋斗吧。
鉴于今天是在鹅厂实习的最后一天,这篇日记还是有一些特殊意义的。
之前想了很多要说的,但真的到要说的时候却不知道该讲些什么了。
脑子里面一直就四个字:“完结撒花”……
好久没有来更新了,借口是因为平常太忙没有时间,其实自己心里也清楚,时间总是有的,多半是被自己在不经意间squander了。
这段时间没干别的事情,写了一个爬虫,可以模拟各种浏览器,顺便自带JS解析器可以解析JS渲染的网站了。目前比较头大的问题就是效率和传统的爬虫比较的话还是太慢。因为要留出足够的JS渲染时间,不得不花费大量的成本去做等待。
解决方法目前也只是量的堆积,开了很大的进程池去跑,效率确实是有所提升了,但明显不是最佳的解决方案。于是又花了时间做异步化的改造,现在看来效果还不错。我把这东西放到github上面了。名字叫Argus,西方神话中的百眼巨人。
之后是做了一个偏前端的东西,导师给了一台测试机,打好LAMP就开工了。之后上了Bootstrap的框架,前端走一波。好久没动前端的东西手果然就生了,中间遇到了一堆让人很抓狂的问题,有的一上午都想不出来。对,期间还手残把一整天的代码都给删掉了。
不过问题总是会被解决的,那种拨云见日找到问题答案的感觉真是太爽了。我想这也是代码狗们的坚持动力吧。
这两天搞一个东西把自己搞的有点想吐血了,啊啊啊啊!
周六心血来潮去逛知乎,看轮子哥装逼,无意间发现了一个js注入的帖子,于是奋不顾身的就跳进了这个大坑。
先是准备工具和环境,所谓工欲善其事必先利其器,除了前几天刚装的Phantomjs,又搞了一个古董版的Nodejs。之后不知道踩了多少坑,装了一个DHCP的server和攻击器,准备开始愉快的玩耍。
在流程进行了大半之后,我突然又发现了一个巨坑,dhcp的攻击器找不到他需要的eth0,再一看原来是vmware把eth0特别有情怀的改成了eno16777736 。
之后在网上找了无数种方法修改,均以失败告终,于是现在的心情就有点郁闷了(宝宝不开心了,宝宝有小情绪了)不过我是不会那么轻易的狗带的,作为一名资深的作死小能手,我决定中午出去愉快的吃个饭,然后趁中午午休的时候再战!!!
拿到鹅厂offer已经好久了,一直都没有写关于面试的经历。
先说说我的大二吧,大家听完一定会觉得特别励志的,2333。当时也不知道是怎么回事,圈子里的朋友都在找实习,于是我也就凑热闹给各大心仪的公司投了offer,结果也是一个个石沉大海,毫无音讯。
寒假的时候在三亚,看到蓝杰群里有人在问谁需要阿里的内推,当时的阿里刚刚上市,如日中天,绝对是我等IT屌丝男的心仪目标。于是就小窗了那个学长(亮神~~),成功内推。再往后有消息就要到开学了,一天我和好哥们在太平老街啃鸡腿,接到了一个电话,“喂,你好,这里是阿里巴巴……”
就这样,开始了漫长的阿里面试之路。一面的小哥很好说话,问的东西也算比较基础的,很愉快的就面完了。过了几天二面,换了一个小哥,声音和第一个面试官超级像,也是愉快的就面完了(别问我为啥不写问了点什么,这么久了我哪记得住)。最后是三面,感觉这个家伙的level肯定不低,面试之前还有专人来跟我预约时间。
三面的时候面试官问了我年级,我说我是大二的,于是面试官开始婉拒,说他们不打算招大二的等等。后来的结果喜闻乐见,rejected。其实原因我也明白一二,要是自己的实力真的足够,人家不会不要你的,年级不到只是个托词而已。
后来在网上投了腾讯,完全没有任何消息,直接跪倒在简历筛选环节。在蓝杰群里搞到了腾讯面试的地点(千年不变茉莉花),和娜姐组队去霸面,结果依然喜闻乐见,在候场厅坐了一天,没有任何结果。再后来又作死的去了武汉霸面阿里,依旧铩羽而归,但旅途还是蛮愉快的,和康凯学长欢脱地逛了一圈昙华林才回长沙。
中间省略很多环节,大二的offer情况是这样的:拿到了中科云华的offer,恒生电子的offer,360的产品经理offer(对!你没看错,就是产品经理~.~)还有几家创业公司的offer。最后选择了去恒生。原因很简单,离阿里近。
之后就没怎么主动地投过简历了,大部分的时间都用在了自己喜欢的事情上,期间狼厂发了凤巢的offer,但我之前面试百度受到过伤害,从此百度一生黑。
大三说实话我没觉得自己和大二得时候有什么不同,但是境遇开始变得没有那么苦逼了。鹅厂发来邮件告诉我去年是因为毕业时间不符被刷掉的,希望我今年继续作战,虽然我知道这绝壁是那种一发一大片的群发邮件,但还是怂怂的去网站上面投了一份简历。
一直到了过完年,还是在三亚,现在的leader给我打了电话,我当时还是在愉快的吃好吃的(好像一直在吃啊啊啊啊)。fatty哥第一次打电话只是想约个正式一面的时间,顺便问了一下我的情况,由于略紧张,感觉发挥的不是很好。第二天一早开始笔试,fatty哥发过来了一份笔试题,在开始笔试之前又问了一些基础的知识,还好都会,缓解了一下紧张的情绪。聊完以后就开始笔试了,好久没有这样做过题,看到第一题就又懵逼了,给了一段代码让你回答会输出什么东西。一开始看完全没思路,后来平静了一下心情一行一行的认真看,发现是个二进制找一的代码,一点都不难……
之后的几道题就比较冷静了,除了一道找第K大数的题目突然想不起来最优算法了之外还算完整的打完了所有题目,写完以后fatty告诉我一面过了。二面的话是现在部门的总监blue总,感觉问的东西蛮有深度的,从他那里学到了不少经验。最后一面是HR面,当时我正在等高铁回三亚,于是和hr姐姐不到半个小时就完成了面试,刚面试完,fatty哥就QQ告诉我,说过了。
拿到鹅厂offer当然是很开心的,开学以后回学校安排了一下生活,就来深圳这边实习了。不得不说鹅厂的福利真的很贴心,不到一个月就吃胖了好几斤,呜呜呜。
又到周末了,终于有时间闲下来可以写写东西了。
这周关于url策略的东西算是开始上手了,前前后后调了好几天,在很多维度方面做了优化。由于每次调试都需要MR,所以进度在刚开始的时候是有些缓慢的。不过经过几天的调试呢,还是有结果产出的,我的第一批策略已经上线跑啦。
前两天和fatty哥聊了一会儿,我们都觉得现在的这个系统有很大的提升空间。举个最简单的例子,在聚集的条件阈值方面就可以从原先的静态(完全是一拍脑袋想出来的)改成自我感知的动态阈值。另外,现在的旁路数据量很丰富,但相对来说偏主观,进行的拦截完全是基于用户之前的行为特征的,如果可以带过来title或者content的字段我觉得应该可以做到客观的去判断url的类型。
时间确实过得很快,我这个新鹅已经入职两周了。有同学来咨询鹅厂的情况,也有同学希望可以和他们一起分享一些经验。等会打算写一个关于鹅厂面试的东东。
18号是周五,组织带我们出去玩了。
组里的同学们一起去深圳湾骑自行车(发现了胶水哥深藏不露的自行车技艺),之后一起去鑫泰吃了饭,味道真心棒!
今天呢,是19号,星期六。不要问我为什么不想写日记,因为策略配不好啊,因为策略配不好啊,因为策略配不好啊,郁闷的事情要说三遍……
然后明天呢,是20号,估计也写不了日记了,在这一并写了吧。明儿参加了深圳百公里行走的活动,估计走完就要累个半死了。然后组织大爱,七点一起去看QQ音乐的年度盛典。所以据本宝宝精密的推算,明天绝对不会写日记的,啦啦啦~
这几天工作算是进入了正轨,开始接触业务了。
刚开始的时候确实有点摸不清头脑,每天都待到十点多才撤,所以日记也就断更了几天。不过经过这两天的奋力摸索,本宝宝已经找到门路啦。
负责的东西是关于Url检测的,主要需要做的是配置好的安全策略,对恶意非法的url进行拦截,当然在有效拦截的同时,也不能有太高的误杀率。
由于实在记不住文件Path,花了点时间写了一个shell脚本,再也不用担心记性不好啦。离线策略这块的Map_reduce是前辈们写好的,开始用着确实方便,不过也深深的被坑过:
一开始上手,我那3月14号的全量恶意数据跑了一次,结果非常好,没有问题。接着我又去修改了一些配置,也很好,Nice!正当我觉得已经会玩,自己构造了一个测试数据集的时候,reduce跑不起来了。。。
自己测试无果之后,跑去找Quinty姐,结果两个人调了半个小时以后还是没找到原因,只好先暂时搁浅。结果过了好久Quinty一路喊着“巨坑啊“的就过来了,原来UGC为了要计算Malice Detention Period会默认拿时间戳的字段,而我的测试集里面为了方便直观,木有加时间戳,于是reduce就直接罢工了。
关于一些其他的,我想说,鹅厂福利真的很好,本宝宝又胖了好几斤。
今天的主要任务就是配环境,简直苦逼。
我记得当时在恒生的时候,也是一大堆权限,不过老大一个邮件就可以直接叫运维开权限,需要用的密码也就只有oa一个。但是在鹅厂就没那么简单了,光是需要记住的密码就有两三个,还附带一个Token。oa的站点多到我打算建一个CHM来帮我记,其实多也就算了,还有一堆oa需要开通权限。
这也许正是腾讯大企业的体现吧,虽然繁杂,但无时无刻都让你觉得正规放心。话说远了,今天由于不熟悉业务网络环境,对着一个没有权限的项目疯狂checkout了半天。接着没有连跳板机就直接连开发机,一直弹connect time out,醉的不要不要的。
中午去医院看病,忘记带钱包,挂号费十元,我全身上下一共九元…… 后来收费的阿姨问我是不是腾讯的,果断少收了一块,这个感情好。
下午给六台新的服务器装环境,由于没有开通外网环境,能做的事情真的很少,在作死用rz传完二进制包之后,果不其然全部受损解压不了了。于是本宝宝写了一堆shell,把六台机器的netcat全部一次性搞定了,这样明天的工作量应该会少一点。另外不知道什么原因,交接文档上提供的yum源貌似不能用了,明天这个应该是重点需要解决的问题。
晚上走的时候,fatty,fany和jason还都没走,各种惭愧啊,正在努力搞一台自行车,这样交通方式解决了,就可以愉快的一起奋斗了。
入职以后的第一个周末,小浩伟来深圳找我玩了。
说实话,离开了学校,身边瞬间少了很多朋友的感觉确实很寂寞。我估计小浩伟过无不及,他已经自己在外面很久了。
周六早上回公司写了一点代码,掐着点去地铁站接到了浩伟,然后再把他带到鹅厂。作为一个刚来两天的green hand,自己其实也啥都不知道,带着浩伟在腾大乱转了一圈,本来说是在腾大吃饭结果由于是周末,又算错了时间,只好去楼下吃麦当劳。
下午去深大转了一圈,由于我提前踩过点,行程还算顺利。晚上接着浪,跑到华侨城感受了一下深圳的土豪气息。
周日本来说是要早点起来的,结果n个闹钟仍然没有阻止我和浩伟睡到了10点,收拾一下,去海边(此处经历坎坷,省略5000字。。。。。。)转了一圈,中午如愿带浩伟去腾大吃了午餐。
之后去深大站送走了浩伟,回公司开始学习shell。感觉这东西还是比较反人类的,用空格来区分参数的方式确实有点DT,不过适应了应该也就会好了。