75道常见AI面试题助你清扫常识盲点附解析

来源：授权自AI科技大本营（ID：rgznai100）

本文干货多，建议收藏。

本文精心准备了一份AI干系岗位的口试题，帮大家扫清知识盲点，自傲上场！

[ 导读 ]正值求职、跳槽季，无论你是换事情还是找演习，没有真本事都是切切弗成的，可是如何高效率复习呢？本日我们为大家精心准备了一份 AI干系岗位的口试题，帮大家扫清知识盲点，自傲上场！

75道常见AI面试题助你清扫常识盲点附解析

机器学习工程师口试

必备口试题：

你会在韶光序列数据集上利用什么交叉验证技能？是用k倍或LOOCV？你是怎么理解偏差方差的平衡的？给你一个有1000列和1百万行的演习数据集，这个数据集是基于分类问题的。
经理哀求你来降落该数据集的维度以减少模型打算韶光，但你的机器内存有限。
你会怎么做？环球均匀温度的上升导致天下各地的海盗数量减少。
这是否意味着海盗的数量减少引起景象变革？给你一个数据集，这个数据集有缺失落值，且这些缺失落值分布在离中值有1个标准偏差的范围内。
百分之多少的数据不会受到影响？为什么？你意识到你的模型受到低偏差和高方差问题的困扰。
那么，该当利用哪种算法来办理问题呢？为什么？协方差和干系性有什么差异？真阳性率和召回有什么关系？写出方程式。
Gradient boosting算法（GBM）和随机森林都是基于树的算法，它们有什么差异？你认为把分类变量当成连续型变量会更得到一个更好的预测模型吗？“买了这个的客户，也买了......”亚马逊的建议是哪种算法的结果？在k-means或kNN，我们是用欧氏间隔来打算最近的邻居之间的间隔。
为什么不用曼哈顿间隔？我知道校正R2或者F值是用来评估线性回归模型的。
那用什么来评估逻辑回归模型？为什么朴素贝叶斯如此“朴素”？花了几个小时后，现在你急于建一个高精度的模型。
结果，你建了5 个GBM（Gradient Boosted Models），想着boosting算法会展现“魔力”。
不幸的是，没有一个模型比基准模型表现得更好。
末了，你决定将这些模型结合到一起。
只管众所周知，结合模型常日精度高，但你就很不幸运。
你到底错在哪里？

以上题目答案详解：https://www.tinymind.cn/articles/109

推举收藏：

机器学习教材中的 7 大经典问题https://www.tiny

算法工程师口试题

事情中的算法工程师，很多时候，会将生活中须臾即逝的灵感，付诸产品化。

将算法研究运用到事情中，与纯粹的学术研究有着一点最大的不同，即须要从用户的角度思考问题。
很多时候，你须要明确设计的产品特色、提升的数据指标，是不是能真正迎合用户的需求，这便哀求算法工程师能在多个模型间选择出最得当的那个，然后通过快速迭代达到一个可以走向产品化的结果。

知识储备作为成功的根底亦必不可少，以下是营长为你精选的算法口试，帮你检讨下自己的技能是否在线。

必备口试题：

LDA(线性判别剖析) 和 PCA 的差异与联系。
K-均值算法收敛性的证明。
如何确定 LDA (隐狄利克雷模型) 中主题的个数。
随机梯度低落法的一些改进算法。
L1正则化产生稀疏性的缘故原由。
如何对贝叶斯网络进行采样。
从方差、偏差角度阐明 Boosting 和 Bagging。
ResNet的提出背景和核心理论。
LSTM是如何实现是非期影象功能的。
WGAN办理了原始 GAN 中的什么问题。

以上题目答案详解：https://www.tinymind.cn/articles/1275

推举收藏：

是男人就过8题！
楼教主出题，请接招https://www.tinymind.cn/articles/47算法和编程口试题精选TOP50！
(附代码+解题思路+答案)https://www.tinymind.cn/articles/375

深度学习12大常见面试题

必备口试题：

1.什么是深度学习？为什么它会如此受欢迎？

3.深度学习与机器学习有什么差异？

4.深度学习的先决条件是什么？

5.选择哪些工具/措辞构建深度学习模型？

6.为什么构建深度学习模型须要利用GPU？

7.何时（何处）运用神经网络？

8.是否须要大量数据来演习深度学习模型？

9.哪里可以找到一些基本的深度学习项目用来练习？

10.深度学习的一些免费学习资源。

末了附上深度学习的干系口试问题有哪些？

深度学习模型如何学习？深度学习模型有哪些局限性？前馈神经网络和递归神经网络之间有什么差异？什么是激活特色函数？什么是CNN，它有什么用场？什么是池化？简述其事情事理。
什么是dropout层，为什么要用dropout层？什么是消逝梯度问题，如何战胜？什么是优化函数？说出几个常见的优化函数。

以上题目答案详解：https://www.tinymind.cn/articles/608

Python常见面试题

100+Python编程题给你练~（附答案）https://www.tinymind.cn/articles/398710个Python常见面试题，这些弄不明白不要说学过Python！
https://www.tinymind.cn/articles/376

Google人工智能口试题

必备口试题：

求导1/x。
画出log (x+10)曲线。
若何设计一次客户满意度调查？一枚硬币抛10次，得到8正2反。
试析抛硬币是否公正？p值是多少？接上题。
10枚硬币，每一枚抛10次，结果会如何？为了抛硬币更公正，该当怎么改进？阐明一个非正态分布，以及如何运用。
为什么要用特色选择？如果两个预测因子高度干系，系数对逻辑回归有若何的影响？系数的置信区间是多少？K-mean与高斯稠浊模型：K-means算法和EM算法的差别在哪里？利用高斯稠浊模型时，若何判断它适用与否？(正态分布)聚类时标签已知，若何评估模型的表现？为什么不用逻辑回归，而要用GBM？每年应聘Google的人有多少？你给一个Google APP做了些修正。
若何测试某项指标是否有增长描述数据剖析的流程。
高斯稠浊模型 (GMM) 中，推导方程。
若何衡量用户对视频的喜好程度？仿照一个二元正态分布。
求一个分布的方差。
若何建立中位数的Estimator？如果回归模型中的两个系数估计，分别是统计显著的，把两个放在一起测试，会不会同样显著？

以上题目答案详解：https://www.tinymind.cn/articles/98

苹果人工智能口试题

必备口试题：

有成千上万个用户，每个用户都有 100 个交易，在 10000 个产品和小组中，用户所参与故意义的部分，你是如何处理这一问题的？为了肃清敲诈行为，我们对这些数据进行预筛选，如何才能找到一个数据样本，帮助我们判断一个敲诈行为的真实性？给出两个表格，一个表格用来存储用户 ID 以及购买产品 ID（为1个字节），另一个表格则存储标有产品名称的产品 ID。
我们考试测验探求被同一用户同时购买的这样一个成对的产品，像葡萄酒和开瓶器，薯片和啤酒。
那么，如何去探求前 100 个同时存在且成对涌现的产品？详细描述 L1 正则化和 L2 正则化二者之间的差异，特殊是它们本身对模型演习过程的影响有什么不同？假设你有 10 万个存储在不同做事器上的文件，你想对所有的文件进行加工，那么用 Hadoop 如何处理?Python 和 Scala 之间有什么差异?阐明一下 LRU Cache 算法。
如何设计一个客户——做事器模型，客服端每分钟都可以发送位置数据。
如何将数据从一个 Hadoop 聚类通报给另一个 Hadoop 聚类？Java 中的内存有哪些不同的类型？你是如何处理数百个标题中的元数据这一繁琐任务的？在数据流和可访问性方面，如何在隐蔽韶光帧内进行丈量？个中在隐蔽韶光帧内，核心超负荷将打算性能量重定向到 cellar dome 的过度繁芜文件系统的边界构造。
你最希望拥有的超能力是什么？如果你有一个韶光序列传感器，请预测其下一个读数。
利用 SQL 创建 market basket 输出。
你有没有过生理物理学实验的履历？（Research Portfolio based question）你在表征方法上的专长是什么？常日利用什么？你是如何在研究中利用它，有没有什么有趣的结果？（Research Portfolio based question）如何进行故障剖析？检讨一个二叉树是否为旁边子树上的镜像。
什么是随机森林？为什么朴素贝叶斯效果更好？

以上题目答案详解：https://www.tinymind.cn/articles/139

— 完 —

关注清华-青岛数据科学研究院官方微信"大众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。

每期AI知识网

75道常见AI面试题助你清扫常识盲点附解析

AI赋能设计分享会丨探索人工智能技能对行业未来的影响

它是华为核心供应商华为海思加持AI液冷做事器利润暴增