书剑恩仇录之我与阿里巴巴

Published on 2015 - 05 - 03

声明

未经本人允许,禁止转载!转载需署名 @Michael282694 + 注明文章出处。否则将按照浏览量(100元 / 10000次PV) + 字图数(200元 / 1000字,20元 / 1图)收取版权费。

欢迎到我提的问题“互联网求职路上,你见过哪些写得很好、很用心的面经?最好能分享自己的面经、心路历程。”中奉献干货,谢谢!


概要

又到了一年一度的实习生招聘季高潮(紧接着便是校招季),学会编写合格的求职简历(参考:『互联网方向』校招信息渠道收集及如何写好技术类求职简历,里面包含了校招求职相关的一些微信公众账号、微博账号、垂直招聘网站和公司官网等的list,以及如何编写技术类求职简历的建议和几本程序员面试必备书籍)和面试是应届生的重要技能之一,有很多人提议我写一写关于这两方面的心得,于是便有了此文。

本文重点安利我的阿里巴巴校招求职经历(腾讯、百度虽然我也面过,但是对公司文化不甚了解,就不误人子弟了),内容主要由几篇旧博客整理而成,旧文新读,旧辞新改。希望能给即将要应聘无论国企还是外企,BAT还是startup的同学带来一点帮助。

整篇文章主要分为以下几个部分:与阿里巴巴校招相关的科普,本人面试经历 + 心得体会、技术类相关微信公众账号和网站list等。


科普

下图是阿里巴巴集团的双序列职业发展(技术 / 管理)体系图。

参考:学在阿里

在阿里巴巴内部,技术岗位一共分为11级(P4~P11),管理岗位一共分为10级(M1~M10),理论上P(x) = M(x - 5),但是同等级的管理岗权利一般比技术岗要大一些。另外,本硕待遇一致,技术岗(在阿里,PD属于技术岗)统一定级P5,普通offer薪资范围为11~14k × 15~16;非技术岗统一定级P4,普通offer薪资范围为6~9k × 15。

下图是阿里巴巴集团的校园招聘岗位table。

参考:校园招聘岗位

其中,具体的offer薪资分布中除运营外面试评级每高一个level(B+ → A → A+),薪资base增加2k。阿里星(A*)是25k × 15 + 若干rus ≈ 60w/y(rsu一般是2000股,分四年每年按25%发放),90%+的人评级是B+。

注意!!!阿里星是没有非技术岗位的,东南大学2009级本科生荣耀大神的运营阿里星offer什么鬼?

P.S:在我写这篇文章的时候,他已经自觉跳出来打脸了,见:阿里真的有运营阿里星?——耀荣的答案

普通offer薪资待遇:

  • 产品类:13k × 15。
  • 运营类:8k × 15(A是9k)。
  • 设计类:交互和用研是11k × 15,视觉和前端是13k × 15(前端后来被划归为技术类),美工不知。
  • 客服类:普通话客户代言人6k × 15,粤语客户代言人8k × 15,英语及其他小语种客户代言人9k × 15。
  • 市场拓展类:不知。
  • 技术类:研发、测试开发、系统、数据挖掘、前端开发、数据研发为13k × 15,算法、客户端开为14k × 15,安全为14k × 16。
  • 数据类:11k × 15。
  • 金融类:不知。
  • 销售类:不知。
  • 综合类:不知。

上述岗位和薪资数据如有误请及时指正,可私信 或 发邮件到 Michael282694@163.com


面试经历相关

  • 阿里巴巴集团安全部实习面试,get offer(5次)
  • 转岗至阿里研究院,实习 + 转正面试,get offer(1 + 2次)
  • 阿里巴巴集团安全部转正面试,get offer(2次)
  • 其他面试,纯属HR(G)傻叉(1 + 1 + 3次)
  • 和HR(G)们的撕逼大战
  • 和技术质量部-淘宝技术质量-创新业务Boss @窥基的微妙关系,get 口头 offer(1次)
  • 我在知乎上其他与校招求职相关的答案

提示:文中涉及到的年份均是以当年为准,请自动忽略。


阿里巴巴集团安全部实习面试,get offer(5次)

关键词:内推,知己知彼

背景介绍:西北皇家工业大学(又名边家村男子职业技术学院)CS学渣,专业方向是图像处理与计算机视觉,小方向是坑爹的超分辨率重建。当年保研脑子进的水,都是现在身上留的汗啊。

首先说明,我面的是研发工程师岗位(非研发岗请自动屏蔽以下文字),部门是阿里巴巴集团安全部,工作方向为图像安全,主要的工作职责包括:黄色图片检测,危险图像过滤,OCR(Optical Character Recognition,光学字符识别),图像场景识别之类的,主要的技术需求是:JAVA(1),Hadoop(2),图像处理与计算机视觉和机器学习(3)等。当然,以上都是通过我对岗位的理解以及和面试官的交谈自己判断的,不一定正确。

当时听说内推的是集团安全部,我吓得都飞到天上去了,学了这么多年CS我连别人QQ号都不会盗,我去安全部难不成天天跟在白帽子屁股后面跪舔啊(其实安全部是一个很大的部门,甚至比有的BU还大,前端、后端、研发、算法、PD、运营里面应有尽有)?师兄解释说那边有个组刚好是做和图像有关的,让我去试试。谁知道我这一试居然硬着头皮把Intern offer拿到了。

下面要开始一段激情洋溢的扯淡,想看面试环节的请直接跳过以下段落。

话说本科大三的暑假,我曾经在支付宝(现蚂蚁金服)平台数据部实习过2个多月,做的是Hadoop相关,所以技术需求(2)我沾边了。我在学校期间一直是写C / C++的(还有Matlab和R),虽然上过Java这门课但是学完后就再也没写过,Java功底基本可以忽略,不过编程语言相对编程思想并不重要,所以勉强和技术需求(1)沾边。最后,我的硕士研究方向是图像处理与计算机视觉,自己也会看一些机器学习方面的东西,再再一次和技术需求(3)沾边。是的,我就是这样一次次被上帝抽中,于是我便开始了“愉快的”面试旅程。其实为什么会被内推到这个岗位呢,中间是有一段故事的,我研究生期间常年在外奔波,为实验室项目鞠躬尽瘁、出差无数(整个硕士生涯到目前为止出差天数累计不下200天),研二期间为了实验室项目出差光北京这一个地方就去了8次(有时候去一次就是15天,去年一共出了120天差),研一阶段基本上也都是在外漂泊(杭州,北京,上海,十堰,洛阳,安康,汉中,成都,昆明,天津,内蒙古,吉林什么的都待过),硕士开题报告是在北京出差时写的,有五门课是在北京出差时考的(把答题册带到北京,对照着手机上拍的参考资料答题,然后再带回学校交掉),好几个任课老师我甚至都没见过长什么样。

扯回来,今年2月底3月初时,我刚好去北京出差,给之前部门的师兄(阿里研究院,p7)打电话约饭,结果他的Base地从北京换到了杭州,饭没约成只好隔着电话寒暄,谈到找工作时他建议我重新回阿里实习 / 工作,聊了一个多小时,回忆起很多以前一起在支付宝实习的美好记忆,也聊了下阿里如今的变化等。最后他说3月上旬阿里要在杭州举办一个大数据峰会,欢迎我过去看看,门票和吃住什么的不用担心。然后我就从北京马不停蹄地赶回西安,然后自费飞到了杭州。当时差点就破产了,不过好在机票真的不贵,来回一共1000+元,就当是旅游喽。这里要谢谢这位中国好师兄,其实他不是我们学校的,当年他实习完就博士退学签了阿里研究院,感谢以前的实习造就了缘分。

在北京期间,顺便面了个试,拿到了某著名211高校非教学教师实习offer一枚(带户口带编制)。

插曲1:在北京总军区出差期间,正好错过CVTE的面试,我就故意跟师长吐槽抱怨:你看,你们老让我过来,这下眼看着到手的offer要飞了,好难过。然后他说:我刚好认识一个人,是我的房客,就在北京百度,要不我帮你内推一下试试?然后他就打开了百度百科,我凑过去一看,王劲,百度高级副总裁,简直吓哭。这推过去不是作死吗,果断拒了。

插曲2:和一起出差的上海某研究所boss聊天,经过我的不懈扯皮,boss居然给了我一个口头offer。算了一下分数,还能落户呢。

飞到杭州,和师兄、茂凯(财务部,P8,负责过3.8手机淘宝节 - 李敏镐代言的case,现已离职)以及窥基(技术质量部,P8)一起吃了一顿饭,参加完西湖品学-大数据峰会,见了很多老朋友(以前team同事),也见到了很多大牛,包括小微金服CRO(现在是阿里云总裁)、车品觉老师、阿里研究院院长叶朋叶先生(已离职)以及整个阿里研究院团队、研究技术经济学的陈平教授,收获颇多。期间和窥基的相识差点让我转去他们团队实习。

以上为内推的背景交代。人活脸树活皮,要想成功就得不要脸。

从杭州回到西安以后,我就开始准备阿里的面试了,当时我也没想到前前后后居然要面一个半月这么久,阿里的HR职业素养简直堪忧。实习生面试一共五轮,这酸爽的过程感动得我两眼泪哇哇,最后一面的HR也被我感动了,说我对阿里还挺执着。其实说到底,支付宝实习 → 在支付宝实习的美女培训班班主任婚礼(绍兴) → 上杭两地出差 → 大数据峰会,年年跑杭州,想不执着都难。

下面言归正传,进入严肃的面试分享环节。

一面,是一个P6的GG打电话过来,主要聊了很多关于我项目和竞赛方面的东西,我的简历上一共有5段项目经历 + 1段实习经历 + 国家级及以上科技竞赛奖项7个(包含一个国际数学建模一等奖),acm渣,技术渣。既然不聊基础,我只好天马行空地吹开了,对于程序员而言口才是非常重要的,很多程序员的表达能力实在是xx,不过无论怎么吹一定要让对方觉得你是靠谱的,不要学某些只会放大炮的大学教授,对话期间一定要突出你的技术水平和技术背景。期间考察了一些关于机器学习方面的知识,比如如何克服overfitting问题,如何选择测试集和训练集,监督学习和非监督学习间的区别,K - means算法步骤。举一个实际生活中用到机器学习的例子,我举的是垃圾邮件分类的问题,然后他问我在这个例子中输入的feature有多少个。以上内容搞机器学习的同学应该都会,答案就不写了。然后问了我一些图像处理方面的问题,比如各种图像格式的特点(*.bmp,*.png,*.tiff,*.jpeg等),一幅图像加载到内存中会占用多少内存空间,了解Google最新发布的图像格式吗(后来百度一下才知道,Google确实发布了一种*.webp格式的图像,我印象中当时除了Google的系统以外只有Qzone在使用这个图像格式)?讲讲*.jpeg图像格式的压缩过程(分割,dct + huffman + zigzag sort等,后来JPEG小组新发布的.jpeg2000格式把dct改进为dwt,即现在的.jpg格式)。聊了聊分布式系统架构,还有Map / Reduce的基本原理。最后问了我两个算法题:

Q1:给你一个很长的英文字符串,中间没有任何标点和空格,再给你一本词典,词典的功能在于告诉你查询的单词是否存在,请问如何才能把这段文字分割成可读的一段话。举个例子,Iamapurebitch,正确分割后是I am a pure bitch,所以要想办法借助词典将字符串正确分割。当然,也有造成歧义的,比如thereisapurebitch,正确的分割应该是there is a pure bitch,这里的there有可能会被断成the re…,所以分出来以后还要基于词典进行纠正(因re非单词)。

A1:我当时提出的是基于香农大神在《信息简史》里提出的词频统计方法,有兴趣的同学可以读一下这本书,非常精彩。大概意思就是像a, b, c, … , z(1个字母)出现的概率都是固定的1/26,但是th, zo(2个字母)出现的概率就要想办法进行统计,再往后是the, zoo(3个字母)的,以此类推。统计得到以后对字符串进行匹配,然后查询词典,从而正确分割长英文字符串。省略细节若干,大家自行补脑。注意,字符串很长,直接搜索肯定是不行的,后来我问了面试官他的思路,他说用递归。然后他问我当字符串很短的时候你的方法还能适用吗?我说那可以考虑递归的问题了。

其实我也不知道我当时的思路对不对,不过正确的解法应该是Word Break算法

Q2:还是给你一个最长的字符串,比如1122223,请给出字符串中出现次数超过一半(或者最多)的字符。

A2:我说借鉴bitmap算法的思想就行。不管英文字母、数字还是ASCII码都不多,内存开销不会太大。这个答案应该是对的,当然,用hash的方法也可以。

面试官让我提几个问题(在以后的每一次面试中都让我提问了),基本上都是围绕着团队背景,团队正在做的事情,我进去以后能做什么,自己在技术上有什么不足希望面试官能提出来。从他的回答中可以感受出对你评价,如果对方说得比较多,说明面试应该是过了。

又过了一个星期多,二面来了,这时我在老校区正心急火燎地给老板搬着砖(我们学校两个校区隔得很远,交通极其不方便),因为经常熬夜,状态非常差。面试官是部门架构师(P9),晚上八点半打电话来,虽然当时手上有活儿很不方便,也只好硬着头皮上了。先自我介绍,有点吞吞吐吐,他可能察觉出我比较紧张,就说那我们聊聊C++吧,问了我C++编译链接的过程,还有C++的内存分配都有哪些类别 / 都是什么,代码量有多少,都分布在哪些地方。当时我脑子很乱,没有答好,面试官听得出来我很疲倦,就说:“这样吧,我们明天下午再约,一会我给你我的联系方式你告诉我你什么时候方便”。然后发了短信给我,顺便在短信里提到让我帮忙内推一些牛逼的小伙伴给他。我拿到联系方式的后的第一反应是赶紧上网搜集面试官的技术背景(当年实习曾依靠人肉帮助小伙伴追过妹子)。88年东南大学机械专业本科毕业,之前在无锡某公司担任高级经理,08年跳槽到阿里巴巴担任架构师。以前实习的时候和部门架构师关系很好,面试时遇到架构师是最难搞的,由于不需要分心管理人事,架构师的纵向技术深度和横向业务熟练度都是部门最好的。基于此,我开始调整自己的面试style,努力提升逼格,让架构师觉得我是一个有大思维的人,这点很重要,因为他们的技术已经很牛逼了,你和他聊技术纵深基本上就是送死,所以你要让他感受到你技术之外但不脱离技术的一些优势。第二天,电话准时打来,我向老板请了半天假,在老校区的宾馆里进行面试。这一次面试官居然率先改了面试style,不再问C++编程功底,而是项目面试。刷夜做的技术面试题库一点没用上,不过还好,项目都是实打实做的,聊起来更如鱼得水。boss面压力很大,因为他的level比你高了不止一点点,所以你很难把握怎么才能说到他觉得是有层次的答案上。期间问了我项目中的一些算法,让我解释了很多图像处理算法,比如图像配准(Harris,SIFT角点等),图像增强,解释了什么是超分辨率重建技术(这一方面问得很细,建议大家对自己的领域要非常熟悉),感觉得出来他很懂计算机视觉领域。问我的软件编写是一般用到哪些开源库,动态还是静态,如何调用以及这样调用有什么优缺点。让我描述一个消息传递(wxWidgets)的详细过程,并说出和MFC消息传递的区别。这一面问得我有点抖,因为他太能见缝插针了,建议在回答问题的时候千万不要蹦新名词,小心被抓住锤死。我犯了一个错误就是我提到了MFC编程,其实我没写过MFC(写过一点点忽略吧),然后就把自己推到火坑里去了。幸亏我是机智的人类,最后力挽狂澜把这个问题圆过去了。面试结束后依然是提问环节,这一次他回答得比较多,甚至连我要学习什么新技术都说了,还介绍了团队发展路线,团队技术背景等。挂断电话时我能猜到肯定过了,然后我就背上小书包愉快地飞赴北京出差去了。因为昨天晚上我告诉面试官最近项目上很忙,北京 - 西安两头跑,他可能也是出于体谅,所以降低了面试难度。切记,boss项目面试并不轻松,虽然避免了很多技术细节的纠缠,但是很考察软件框架思维,很容易问得出来你有没有真正做过,很多人都是死在这一面的。

然后,boss说还会有1 - 2轮面试,今年阿里对实习生招聘要求很高,我这里通过了不代表你能拿到Intern offer。上网看了一下,面试进度从应聘中变成了应聘通过,这一刻我还以为我已经完美了,没想到我的人生开启了hard模式,后面还有整整三轮面试。

第三轮面试之前,集团某HR给我打了个电话通知说明早上会有人面试你,请做好准备,我问了一句,是技术面还是HR面,那个高贵冷艳的姐姐说,技术面,然后就把电话给我挂了。尿性!好吧,继续看书继续准备。二面和三面之间,又是一个多星期的间隔。第二天早上,请假待在宿舍等面试,因为我有胃病,当时肚子不太舒服想出恭,结果刚走到厕所电话就打来了(10:50,都快中午了,秋水都望穿了,秋裤也忘穿了)。跑到宿舍,调整状态开始面试,这一次是电话群面,通过电话了解应该有2 - 3个人,花名没记住(后来才知道带头发问的是隔壁团队老大,P8)。顺势说出了自己的花名,摆出一幅我就是你们的人赶紧来领走不要墨迹的死皮赖脸态度,让他们觉得你是有诚意的。群面一共半小时,比起之前两次都超过一个小时的面试轻松多了,依然是项目面试,问了一些比如项目核心技术,做项目的过程中遇到的最大困难,未来的学习计划之类,好像变成了HR面一样。因为参与过一个国家级重点攻关项目一箭三星,当时觉得好有底气,试图在气势上压倒面试官。考察脸皮的时刻到了,要把别人不懂你懂的说成他能懂的,把别人懂的说成靠谱的,放大优点避免暴露缺点。

三面华丽通过,面试进度变成了终面通过,给内推我的师兄发了感谢信表达谢意。然后开始面腾讯,二面遇到了一个奇葩的面试官(Jeff,据说是Google挖回来的架构师),一句话不说叫我徒手写了一个小时代码,然后就跪了。因为接到面试通知的时候正在洛阳出差,连夜赶火车回西安参加面试,人特别累,跪了也是情有可原。

一直等啊等啊,秋水都等出500度的近视了,阿里还不给我通知,给二面面试官发封email问了下情况,他说还会有一次现场面试,我真是日了狗了。

14 - 15号终于来到,收到前程无忧的短信让我14号去xx酒店参加面试,面试时间是早上九点(第一个),亲娘嘞,坐车要三个小时才能到。早上六点就起来赶车,因为是周一,各种堵车。8点58分,我终于闪亮地出现在面试现场,还好赶上了。我猜测阿里把招聘外包给前程无忧肯定是因为阿里的校招混乱,怕HR被砍吧。

现场第一次技术面试,还是一个小时,我继续摆出一幅我就是你们的人赶紧来领走不要墨迹的死皮赖脸态度,面试官(淘宝,P8)看我之前面了三轮面试的评价,没有为难我太多,依然是问项目相关。由于起早了,又坐车太久,我脑子不好使,感觉回答得很一般,可能现场压力也比较大一些吧。跟我聊了一下STL,三种顺序容器四种关联容器,说到list的时候,问了我如何优化链表的效率。然后聊排序(还分析了时空复杂度),讲了八种。当时真是各种大神附体,总书记附体,奥巴马都附体了,一气呵成。面试官觉得我还算靠谱,就过了。还问了我最近在看什么技术书籍,行业领军人物都有哪些?和他们有技术来往吗?我觉得说到技术书籍一定要先评估面试官的技术方向,比如阿里大部分面试官Java比较厉害,而你是写C / C++的,就得尽量弱化你看过的Java书籍。另外,我感觉面试官应该不懂机器学习,就一口气说了很多机器学习方面的书籍,关于行业领军人物这个问题,我和雅虎的首席科学家Alexander Johannes Smola, Alex(现在跳槽到谷歌做Researcher了)等有过邮件技术交流,浙大的、北大的、北航等的老师我也都认识。我感觉面试官主要想考察你是否对自己所在领域是否熟悉,无它。

刚准备离开面试场地,就被前程无忧的引导员抓住,转身接着面HR,又是一个小时。好在HR是小微金服(现在的蚂蚁金服)的,而且认识我以前的老大,有一种再一次被上帝抽中的感觉。期间HR不断给我施加压力,分析case,阐述在项目团队合作中的短板,比如他指出我在做项目leader时分人员调配不合理的地方,并让我给出更好的方案。还有,这辈子遭遇过最大的挫折是什么,失控情绪是否会影响到工作态度,该如何调整?分析一下个人优缺点,自己对未来有什么规划,如何看待和选择BAT?甚至细致到问我为什么有在手背写字的习惯,其实我只是想把前面面试官给我的一点建议记录下来,一共就几个字。资深的专业级HR说话总是能点到为止,通过交流我能明显感觉到这个offer我是吃定了(静候五月初发Intern offer),但是你完全无法从对话中得到肯定的答案。同时他也提了一些建议,比如表达观点的时候语速比较慢,做技术要讲求合作不要硬扛,表达时缺乏表现力。其实我平时说话语速特别快,可能那天早上真的很累吧。这一次,我的面试进度变为了面试已完成。私下交流发现,别人的hr面都很轻松,都是问一些什么时候入职啊、喜欢什么颜色之类的问题,HR面难度因HR而异吧。

回来以后给内推我的师兄发了一个微信吐槽阿里的进度太慢。当时我正在准备面GE的二面,而且手上已经好几个offer了(非BAT,腾讯二面挂了,百度还没开始)。师兄帮我分析了面试过程,觉得我没有问题。然后又提出来问我去不去技术质量部,窥基还在等我的答复呢。感动啊,居然就这么得到了一个口头offer,而且那边说不需要笔试面试直接进,再一次被上帝抽中。我回复还是等这边岗位下来了再说吧,两头搞最后不好交代,如果这边跪了我就去技术质量部。其实我觉得这边应该没有问题,当然这是自我感觉良好罢了。

有朋友问过我为什么不重回小微金服(现蚂蚁金服)实习,主要是因为我对Hadoop没兴趣,以及我想换个team体验。


转岗至阿里研究院,实习 + 转正面试,get offer(1 + 2次)

关键词:主动,格局观

先说结论:

1) 在拿到安全部实习offer之前,我和阿里研究院-数据平台接洽过一次(算是实习生面试吧)。在安全部实习期间,抽了一个上午和一个下午分别加面了两轮,赶在安全部转正面试(8.15日)之前拿到了阿里研究院的正式校招offer,准备在结束安全部的实习之后转岗过去重新实习,岗位从研发工程师 → 算法工程师。

2) 截止8月底,将一直在安全部实习,目前正在完成一个用于海量网页文本内容去重的算法:SimHash算法。被师兄一番游说,便提了转岗。

第一次面试

隐约记得是5月份,接到过一个来自北京的电话(对方主管,当时P8),勉强算做第一次面试吧,半个小时不到,没问任何技术问题,都是寒暄。由于当时阿里研究院没有校招 / 实习生Headcount,面试完也就不了了之。不过留下了伏笔:对方去申请校招名额,如果校招过后还有意向,可以直接内部转岗过去,直接发正式校招offer。

第二次面试(我主动发邮件联系的)

第二次面试是在7月25日(周五)上午10:30左右,约40分钟。还是对方主管面试,我从三楼直接上六楼去,在咖啡吧面试的。

抛开寒暄,主要聊到了我在学校期间做过的项目一箭三星,谈谈关于如何做好政府项目(阿里和北斗卫星、中央气象局的合作项目)的看法等。

如何看待草根文化?,正好看过一些研究富人 & 穷人经济的材料,比如:《贫穷的本质》,大局把控好,回答起来并不难。

简单交流了我在安全部实习期间做的项目(海量网页文本内容去重:SimHash算法)。

最后,对方主管给我介绍团队最近在做的事情(最新的presentation show,微信公众账号aliresearch里沉淀的案例,团队愿景,我作为(阿里研究院历史上第一枚)实习生进去以后能做的事情。

总结:感觉虽然面试轻松,但是暗藏杀机,因为讨论的都是宏观的社会 / 经济学问题,对方主管在把控你的宏观思维。还好鄙人平时善吹水,喜读书。

转岗建议:技术是次要的,抓住机会让对方主管觉得你靠谱,充分展现你的竞争力和潜力。能进阿里实习的,技术和天资一般不会太差。

第三次面试

第三次面试是在7月30日(周三)下午04:30左右,约40分钟。1 VS 2,对方主管(P9) + 阿里研究院院长叶朋叶先生(M6,副总裁,花名傲天)。对话内容有:

你为什么要转岗过来?我说是为了资源,技术基础决定门槛,资源/环境决定成就,仙人指路决定造诣,所以我来了。

你实习期间做了什么?一定要有数字评估指标,比如像我做的用于海量网页文本内容去重的SimHash算法,被追问了算法去重率,测试数据集上的效果(准确率和召回率)等硬性指标,当然还有算法原理简介。

你觉得现在做的工作和即将要做的工作有没有可以结合的地方?这主要是看你有没有可塑性,转岗以后能不能胜任,如果没有可以结合的地方,请阐述你觉得你能胜任转岗以后工作的理由。从数据仓库开发(支付宝,现蚂蚁金服实习经历)→ 图像处理与计算机视觉(硕士研究方向)→ 文本数据挖掘(安全部实习经历)→ 数据挖掘(未来在阿里研究院的岗位),@傲天评价我每一次转换跳跃都很大,我也是醉了。

你做过比较疯狂的事情是什么?我说我高考完了带着200块钱徒步旅行了15天,经历了各种生死(洪水、塌方、泥石流、暴雨、车祸等),然后去昆明继续疯了15天,最后平安回到家。

你有什么兴趣爱好?我说我担任过校武术协会副会长和院学生会文艺部副部长等。

最重要的一点,对方会叫你设想如果你的主管来评价你,会认为你有什么缺点?妹子啊,我上一次实习都是3年前的事情了,这次来我主管和我压根就不在一栋楼(他老人家在项目室),我哪知道他会怎么评价我。这个问题没答好,被 @傲天抓住一个瑕疵批判了好几分钟。

对方还问我是否介意他们打电话给现任 / 前任主管咨询我的实习表现。

感觉副总裁也是蛮拼的,为了一个实习生转岗面了40几分钟。

结局:后续反馈面试结果很好^_^,副总裁当场拍板宣布发offer,并提出可以给我主管的主管的主管打招呼协助转岗。


阿里巴巴集团安全部转正面试,get offer(2次)

关键词:踏实勤恳,知之为知之不知为不知

因为已经提前拿到了阿里研究院的口头校招offer,但人还在安全部实习,加上产品马上成型 / 上线,就没好意思提转岗的事情(HRG说实习生转岗和正式员工流程一样,并且需要自己发起,我...),然后今天下午被直线主管莫名其妙地拉去面试了,这才意识到事态发展不对,再面下去,等我的简历被安全部lock掉,转岗就更难了(正式员工转岗需要在本部门待满一年及以上)...

面试之前,主管review了近期工作,沟通了关于SimHash算法的实现细节:

  • 有多少种常用的Hash函数?可以被应用到SimHash算法中的又有哪些?——略。
  • SimHash中Hash函数的设计和普通Hash函数有什么区别?——前者基于局部敏感哈希(Locality-Sensitive Hashing, LSH)框架,后者容易引起雪崩效应。
  • MD5(Message Digest Algorithm MD5,消息摘要算法第五版)算法和SimHash算法在应用上有什么区别?为什么不能用MD5算法生成指纹?
  • 以粗粒度的单词作为文本feature计算文本内容的SimHash Code,效果会不会不如以核心短句作为文本feature准确?对最终的文本内容相似度Hamming Distance计算会造成哪些影响?——以核心短句作为文本feature最终效果肯定更精确,但是提取难度大。
  • 针对淘宝论坛帖子网页文本内容去重场景,对提取到的文本feature weight直接赋1和赋TF - IDF相比,哪一种方法更精确?——TF - IDF,语料库需要自己训练。
  • 用Jsoup提取到的淘宝论坛帖子网页文本正文应如何去噪?淘宝论坛帖子网页的评论对新进相似网页(评论为0 / 很少)的内容判重有何影响?——对AliWS(Alibaba Word Segment)后的结果进行预处理,去掉虚词、助词以及停顿词等;后续将研究如何精确提取淘宝论坛帖子网页文本正文。
  • 直接解析Html定位淘宝论坛帖子网页内容正文是否可行?——可以直接过滤网页title(眉)、版权申明(脚)等冗余信息,可一旦更换Html结构这种方法可能失效(因为Html中正文标签不是固定的,淘宝论坛帖子网页采用的是ke - post)。
  • ......

面试其实也不难:

  • 先给我介绍了一下转正流程:主管review + 面试(非必须,取决于主管),BU高P面试,集团(跨BU)高P面试。一共三轮,如果实习时间超过三个月,主管review通过后直接进入集团(跨BU)高P面试环节。其实说到底,实习生转相当于重新走了一遍校招流程,不符合上述流程的同学,都是人品问题。和那些拿到offer不来实习并进入绿色通道(校招时直接进入终面)的同学相比,简直神坑...
  • (来实习前)自我技术背景介绍。→主要编程语言有C++/Matlab/R,CV专业出身,对ML感兴趣。
  • 职业规划。→ 架构师,然后开始被主管以大主管的生平事迹进行批斗和教育......
  • 技术方向和技术发展愿景。→ Computer Vision (CV), Data Mining (DM), Machine Learning (ML), Pattern Recognition (PR), Big Data, etc.
  • ......
  • 描述QSort的实现原理?如何破坏QSort的复杂度,让其从O(N·logN)变成O(N^2)。→ 略;参考

在最坏情况下,快速排序算法的运行时间复杂度是O(n^2)。这种情况的一个例子是对已经排序的文件,如果我们选择最后一个项作为划分项,也就是已排序数组中的最大项,我们分区的结果是分成了一个大小为N-1的数组和一个大小为1的数组,这样的话,我们需要的比较次数是N + N-1 + N-2 + N-3 + ... + 2 + 1 = (N + 1)N / 2 = O(n^2)。
 
建议阅读C++ STL中的QSort函数源码:整体采用QSort,局部采用Insert Sort的混合排序框架。

  • 讲一个你用过的Machine Learning例子。→ Classification。
  • C++是如何申请动态二维数组的? → 参考

面试结果:官网查询状态是二面通过(来往查询状态是初面通过)。后续应该还有两轮面试:BU高P面试,集团(跨BU)高P面试。

转正面试建议:及时更新简历并复习基础知识,总结实习内容(框架 / 算法 / 技术等)。

转岗建议:必须有本人发起,最好是确认对方团队愿意接收你了(面试通过),再向你的直线主管提出,然后两边大小主管和HRG会进行手续移交。

=====转岗示意===== 

1 实习生转正 ? 发校招offer : 滚粗 & 不能参加校招;
 
2 实习生转岗 ? 发校招offer & 进入新BU : 滚粗 & 不能参加校招;
 
3 实习生转正 | 转岗 ? 幸福地生活在阿里巴巴 : 滚粗 & 不能参加校招 but 以后可以走社招;

关于为什么转岗,除了前面写的,还有就是:来阿里实习的日子,就像是跳起来摸了一下天空,很开心,也很充实!但是,我想离天空更近一步。

不出意外,我应该不会再参加后续面试了,为了身心健康,我决定提前转岗。

=====后续发展=====

今天(2014/08/13)又被抓去参加了一轮面试,主管的主管的主管 @柳彬(总监)和HR @源火一起面的。其实整个过程很轻松,就半个小时,HR不断发问,总监偶尔插一个问题进来,主题围绕着实习期工作自评表上的内容,两段实习的异同(支付宝 vs. 安全部),实习项目,在实习工作中遇到的困难(如何克服?),在面对这份工作时存在的不足等。

面试结果:官网查询状态是四面通过(来往查询状态是面试已完成),get offer。

建议:思考清楚未来规划,自身不足(工作中和生活中)。带上打印版的简历和实习期工作自评表。

下图是我在阿里巴巴被面试的过程记录(比较正式的前11次):


其他面试,纯属HR(G)傻叉(1 + 1 + 3次)

关键词:HR(G)是傻叉

各种交叉面试,被迫转岗面试,叉来叉去叉HR(G)老木。

阿里云潘磊(P10)。

参考:在阿里巴巴当 HR 是怎样一种体验?——Michael282694的答案

蚂蚁金服,羽单(P8)。

阿里妈妈,擎涛(P7) → 九吾(P8)→ 云雀(P9)。


和HR(G)们的撕逼大战

关键词:规则,垃圾

被6个HR(G)搅得头晕脑胀,听说现在各种查缺补漏修改校招规则。外包HR严君梅,HR总监刘湘雯,从上到下都是拿钱买屎吃的饭桶。


和技术质量部-淘宝技术质量-创新业务Boss @窥基的微妙关系,get 口头 offer(1次)

很感谢 @窥基对我的信任和支持,虽然最后没能成为同team的战友,他是一个好Boss,值得跟随。


我在知乎上其他与校招求职相关的答案


其他

个人觉得,阿里比较侧重于“个人潜力”,最近几年已经逐渐沦为码农收割工厂,百度(不讨论IDL)比较侧重基础知识(数据结构和算法,以及实习经历和项目经验),腾讯比较侧重于基础(数据结构、算法、操作系统和计算机网络,对实习经历和项目经验的重视程度不如阿里)。

题外话:现在再看到这些文字,忍俊不禁,为了尽可能真实地还原当时的心境,我只做了少量bug fixed,目的是让大家看到那时的我也曾迷茫、也曾犯傻,也曾搞笑。


技术类相关微信公众账号和网站list

技术类相关微信公众账号和网站


至此,我将再也不会回答知乎上关于阿里巴巴校招的任何问题,我只对黑阿里、黑各路HR(G)感兴趣,挽尊。

利益相关:10+个校招offer获得者。

Comments
Write a Comment
  • 540851831 reply

    请问您在阿里实习过程中如何参加其它公司的面试的呢?