机器学习算法工程师面试需要做那些准备

机器学习算法工程师面试需要做那些准备?

1 业界的大规模模型基本上是logistic regression和linear regression,所以sgd 和lbfgs很重要要了解,并行求导很重要要了解lr怎么并行

机器学习算法工程师面试需要做那些准备 - 汇30资讯

2 其次就是常见的机器学习算法,比如svm gbdt knn等,要做到原理了解,能在压力下快速应答。算法的优劣和适应场景也要基本清楚

3基本的算法数据结构要熟练,链表二叉树,快排归并动归等等…

前段时间我们在公司内部做了一期采访,针对我司机器学习的研究院和工程师当初面试经过的,一共采访了九个人,正好可以回答这个问题。下面摘取其中两个:

我之前是在研究院工作了两年,之所以考虑来企业,一方面是处于生活上的考虑,还有一方面是因为现在学校其实已经离科技前沿越来越远了,因为做科研需要很多数据,而这些数据越来越集中在企业的手里。譬如我们之前有两个项目其实都是和国内巨头互联网公司合作的,但是那些数据也不会给我们。所以现在越来越多的学术大牛比如杨老师都已经走入工业界了。

我的面试是在公司,三位面试官一起跟聊了四个多小时。先是问我用过一些什么样的算法,以工作项目为切入点,主要是和机器学习有关的项目。我之前在做机器视觉图像处理处理方面的工作,问我的主要是CNN,以及关于神经网络的一些基本概念。问了我一个现在很新颖也很流行的模型叫VGG,然后面试官问我是怎样训练这个模型的,因为现在市面上已经有训练好了的现成的模型可以直接使用。我的回答是我是有自己训练的,并且我自己剪裁了后面几层网络,加上了我自己设计的一个全连接的模型,整个模型进行重新训练。然后还问我训练过程中有没有考虑过over fitting的问题,我的回答是增加数据量,减少模型复杂度,然后面试官也提出了动态调节这种方法。后面我们又聊了些图像的特征,因为我们做图像的时候常遇到非常大的数据,就涉及到怎样压缩这样的数据。回答的也都还比较顺畅。

然后还问了我自己做的一些项目,音频指纹和视频指纹算法。这个技术可以用来标识和代表一段音频,用来做搜索和版权保护等方面的工作。另外图像指纹算法也是类似的原理,主要也是利用图像的频谱特性,但是提取特征点的方法不同。这个环节面试官问了我一些具体的算法和细节,比如landmark, DCT, STFT. 还聊了一些关于搜索方面的技术,这个就主要是面试官给我讲了,大家互相分享。