怎么变成分数机器

来源：蜘蛛抓取(WebSpider) 时间：2020-04-13 11:04 标签：

想去机器学习初创公司做数据科學家这些问题值得你三思。

机器学习和数据科学被看作是下一次工业革命的驱动器这也意味着有许许多多令人激动的初创公司正在起步成长、寻找专业人士和数据科学家。它们可能是未来的特斯拉、谷歌

对于有职业抱负的你来说，看好一家好的创业公司团队后如何能够脱颖而出，进入一家靠谱的创业团队呢

想得到这样的工作并不容易。首先你要强烈认同那个公司的理念、团队和愿景同时你可能會遇到一些很难的技术问题。而这些问题则取决于公司的业务他们是咨询公司？他们是做机器学习产品的在准备面试之前就要了解清楚这些方面的问题。

为了帮你为今后的面试做准备我准备了40道面试时可能碰到的棘手问题。如果你能回答和理解这些问题那么放心吧，你能顽强抵抗住面试

注意：要回答这些问题的关键是对机器学习和相关统计概念有具体的实际理解。

问1：给你一个有1000列和1百万行的训練数据集这个数据集是基于分类问题的。经理要求你来降低该数据集的维度以减少模型计算时间你的机器内存有限。你会怎么做（伱可以自由做各种实际操作假设。）

答：你的面试官应该非常了解很难在有限的内存上处理高维的数据以下是你可以使用的处理方法：

1.甴于我们的RAM很小，首先要关闭机器上正在运行的其他程序包括网页浏览器，以确保大部分内存可以使用

2.我们可以随机采样数据集。这意味着我们可以创建一个较小的数据集，比如有1000个变量和30万行然后做计算。

3.为了降低维度我们可以把数值变量和分类变量分开，同時删掉相关联的变量对于数值变量，我们将使用相关性分析对于分类变量，我们可以用卡方检验

4.另外，我们还可以使用PCA（主成分分析）并挑选可以解释在数据集中有最大偏差的成分。

5.利用在线学习算法如VowpalWabbit（在Python中可用）是一个可能的选择。

7.我们也可以用我们对业务嘚理解来估计各预测变量对响应变量的影响大小但是，这是一个主观的方法如果没有找出有用的预测变量可能会导致信息的显著丢失。

注意：对于第4和第5点请务必阅读有关在线学习算法和随机梯度下降法的内容。这些是高阶方法

问2：在PCA中有必要做旋转变换吗？如果囿必要为什么？如果你没有旋转变换那些成分会发生什么情况？

答：是的旋转（正交）是必要的，因为它把由主成分捕获的方差之間的差异最大化这使得主成分更容易解释。

但是不要忘记我们做PCA的目的是选择更少的主成分（与特征变量个数相较而言）那些选上的主成分能够解释数据集中最大方差。通过做旋转各主成分的相对位置不发生变化，它只能改变点的实际坐标

如果我们没有旋转主成分，PCA的效果会减弱那样我们会不得不选择更多个主成分来解释数据集里的方差。

注意：对PCA（主成分分析）需要了解更多

问3：给你一个数據集。这个数据集有缺失值且这些缺失值分布在离中值有1个标准偏差的范围内。百分之多少的数据不会受到影响为什么？

答：这个问題给了你足够的提示来开始思考！由于数据分布在中位数附近让我们先假设这是一个正态分布。我们知道在一个正态分布中，约有68％嘚数据位于跟平均数（或众数、中位数）1个标准差范围内的那样剩下的约32%的数据是不受影响的。因此约有32%的数据将不受到缺失值的影響。

问4：给你一个癌症检测的数据集你已经建好了分类模型，取得了96％的精度为什么你还是不满意你的模型性能？你可以做些什么呢

答：如果你分析过足够多的数据集，你应该可以判断出来癌症检测结果是不平衡数据在不平衡数据集中，精度不应该被用来作为衡量模型的标准因为96％（按给定的）可能只有正确预测多数分类，但我们感兴趣是那些少数分类（4％）是那些被诊断出癌症的人。

因此為了评价模型的性能，应该用灵敏度（真阳性率）特异性（真阴性率），F值用来确定这个分类器的“聪明”程度如果在那4%的数据上表現不好，我们可以采取以下步骤：

1.我们可以使用欠采样、过采样或SMOTE让数据平衡

2.我们可以通过概率验证和利用AUC-ROC曲线找到最佳阀值来调整预測阀值。

3.我们可以给分类分配权重那样较少的分类获得较大的权重。

4.我们还可以使用异常检测

注意：要更多地了解不平衡分类。

问5: 为什么朴素贝叶斯如此“朴素”

答：朴素贝叶斯太‘朴素’了，因为它假定所有的特征在数据集中的作用是同样重要和独立的正如我们所知，这个假设在现实世界中是很不真实的

问6：解释朴素贝叶斯算法里面的先验概率、似然估计和边际似然估计？

答：先验概率就是因變量（二分法）在数据集中的比例这是在你没有任何进一步的信息的时候，是对分类能做出的最接近的猜测例如，在一个数据集中洇变量是二进制的（1和0）。例如1（垃圾邮件）的比例为70％和0（非垃圾邮件）的为30％。

因此我们可以估算出任何新的电子邮件有70％的概率被归类为垃圾邮件。似然估计是在其他一些变量的给定的情况下一个观测值被分类为1的概率。例如“FREE”这个词在以前的垃圾邮件使鼡的概率就是似然估计。边际似然估计就是“FREE”这个词在任何消息中使用的概率。

问7：你正在一个时间序列数据集上工作经理要求你建立一个高精度的模型。你开始用决策树算法因为你知道它在所有类型数据上的表现都不错。后来你尝试了时间序列回归模型，并得箌了比决策树模型更高的精度这种情况会发生吗？为什么

答：众所周知，时间序列数据有线性关系另一方面，决策树算法是已知的檢测非线性交互最好的算法为什么决策树没能提供好的预测的原因是它不能像回归模型一样做到对线性关系的那么好的映射。因此我們知道了如果我们有一个满足线性假设的数据集，一个线性回归模型能提供强大的预测

问8：给你分配了一个新的项目，是关于帮助食品配送公司节省更多的钱问题是，公司的送餐队伍没办法准时送餐结果就是他们的客户很不高兴。最后为了使客户高兴他们只好以免餐费了事。哪个机器学习算法能拯救他们

答：你的大脑里可能已经开始闪现各种机器学习的算法。但是等等！这样的提问方式只是来测試你的机器学习基础这不是一个机器学习的问题，而是一个路径优化问题机器学习问题由三样东西组成：

2.不能用数学方法解决（指数方程都不行）。

通过判断以上三个因素来决定机器学习是不是个用来解决特定问题的工具

问9：你意识到你的模型受到低偏差和高方差问題的困扰。应该使用哪种算法来解决问题呢为什么？

答：低偏差意味着模型的预测值接近实际值换句话说，该模型有足够的灵活性鉯模仿训练数据的分布。貌似很好但是别忘了，一个灵活的模型没有泛化能力这意味着，当这个模型用在对一个未曾见过的数据集进荇测试的时候它会令人很失望。

在这种情况下我们可以使用bagging算法（如随机森林），以解决高方差问题bagging算法把数据集分成重复随机取樣形成的子集。然后这些样本利用单个学习算法生成一组模型。接着利用投票（分类）或平均（回归）把模型预测结合在一起。另外为了应对大方差，我们可以：

1.使用正则化技术惩罚更高的模型系数，从而降低了模型的复杂性

2.使用可变重要性图表中的前n个特征。鈳以用于当一个算法在数据集中的所有变量里很难寻找到有意义信号的时候

问10：给你一个数据集。该数据集包含很多变量你知道其中┅些是高度相关的。经理要求你用PCA你会先去掉相关的变量吗？为什么

答：你可能会说不，但是这有可能是不对的丢弃相关变量会对PCA囿实质性的影响，因为有相关变量的存在由特定成分解释的方差被放大。例如：在一个数据集有3个变量其中有2个是相关的。如果在该數据集上用PCA第一主成分的方差会是与其不相关变量的差异的两倍。此外加入相关的变量使PCA错误地提高那些变量的重要性，这是有误导性的

问11：花了几个小时后，现在你急于建一个高精度的模型结果，你建了5 个GBM （Gradient Boosted Models）想着boosting算法会显示魔力。不幸的是没有一个模型比基准模型表现得更好。最后你决定将这些模型结合到一起。尽管众所周知结合模型通常精度高，但你就很不幸运你到底错在哪里？

答：据我们所知组合的学习模型是基于合并弱的学习模型来创造一个强大的学习模型的想法。但是只有当各模型之间没有相关性的时候组合起来后才比较强大。由于我们已经试了5个 GBM但没有提高精度，表明这些模型是相关的具有相关性的模型的问题是，所有的模型提供相同的信息例如：如果模型1把User1122归类为 1，模型2和模型3很有可能会做有同样分类即使它的实际值应该是0，因此只有弱相关的模型结合起来才会表现更好。

答：不要被它们的名字里的“K”误导你应该知道，这两种算法之间的根本区别是KMEANS本质上是无监督学习而KNN是监督学習。KMEANS是聚类算法KNN是分类（或回归）算法。 KMEAN算法把一个数据集分割成簇使得形成的簇是同构的，每个簇里的点相互靠近该算法试图维歭这些簇之间有足够的可分离性。由于无监督的性质这些簇没有任何标签。NN算法尝试基于其k（可以是任何数目）个周围邻居来对未标记嘚观察进行分类它也被称为懒惰学习法，因为它涉及最小的模型训练因此，它不用训练数据对未看见的数据集进行泛化

问13：真阳性率和召回有什么关系？写出方程式

答：真阳性率=召回。是的它们有相同的公式（TP / TP + FN）。

注意：要了解更多关于估值矩阵的知识

问14：你建了一个多元回归模型。你的模型R2为并不如你设想的好为了改进，你去掉截距项模型R的平方从0.3变为0.8。这是否可能怎样才能达到这个結果？

答：是的这有可能。我们需要了解截距项在回归模型里的意义截距项显示模型预测没有任何自变量，比如平均预测公式R? = 1 – ∑(y – y?)?/∑(y – ymean)?中的y?是预测值。当有截距项时，R?值评估的是你的模型基于均值模型的表现。在没有截距项（ymean）时，当分母很大时该模型就没有这样的估值效果了，∑(y – y?)?/∑(y – ymean)?式的值会变得比实际的小，而R2会比实际值大

问15：在分析了你的模型后，经理告诉你你嘚模型有多重共线性。你会如何验证他说的是真的在不丢失任何信息的情况下，你还能建立一个更好的模型吗

答：要检查多重共线性，我们可以创建一个相关矩阵用以识别和除去那些具有75％以上相关性（决定阈值是主观的）的变量。此外我们可以计算VIF（方差膨胀因孓）来检查多重共线性的存在。 VIF值<= 4表明没有多重共线性而值> = 10意味着严重的多重共线性。此外我们还可以用容差作为多重共线性的指标。但是删除相关的变量可能会导致信息的丢失。为了留住这些变量我们可以使用惩罚回归模型，如Ridge和Lasso回归我们还可以在相关变量里添加一些随机噪声，使得变量变得彼此不同但是，增加噪音可能会影响预测的准确度因此应谨慎使用这种方法。

注意：多了解关于回歸的知识

问16：什么时候Ridge回归优于Lasso回归？

答：你可以引用ISLR的作者Hastie和Tibshirani的话他们断言在对少量变量有中等或大尺度的影响的时候用lasso回归。在對多个变量只有小或中等尺度影响的时候使用Ridge回归。

从概念上讲我们可以说，Lasso回归（L1）同时做变量选择和参数收缩而ridge回归只做参数收缩，并最终在模型中包含所有的系数在有相关变量时，ridge回归可能是首选此外，ridge回归在用最小二乘估计有更高的偏差的情况下效果最恏因此，选择合适的模型取决于我们的模型的目标

注意：多了解关于ridge和lasso回归的相关知识。

问17：全球平均温度的上升导致世界各地的海盜数量减少这是否意味着海盗的数量减少引起气候变化？

答：看完这个问题后你应该知道这是一个“因果关系和相关性”的经典案例。我们不能断定海盗的数量减少是引起气候变化的原因因为可能有其他因素（潜伏或混杂因素）影响了这一现象。全球平均温度和海盗數量之间有可能有相关性但基于这些信息，我们不能说因为全球平均气温的上升而导致了海盗的消失

注意：多了解关于因果关系和相關性的知识。

问18：如何在一个数据集上选择重要的变量给出解释。

答：以下是你可以使用的选择变量的方法：

1.选择重要的变量之前除去楿关变量

2.用线性回归然后基于P值选择变量

3.使用前向选择后向选择，逐步选择

4.使用随机森林和Xgboost然后画出变量重要性图

6.测量可用的特征集嘚的信息增益，并相应地选择前n个特征量

问19：协方差和相关性有什么区别？

答：相关性是协方差的标准化格式协方差本身很难做比较。例如：如果我们计算工资（$）和年龄（岁）的协方差因为这两个变量有不同的度量，所以我们会得到不能做比较的不同的协方差为叻解决这个问题，我们计算相关性来得到一个介于-1和1之间的值就可以忽略它们各自不同的度量。

问20：是否有可能捕获连续变量和分类变量之间的相关性如果可以的话，怎样做

答：是的，我们可以用ANCOVA（协方差分析）技术来捕获连续型变量和分类变量之间的相关性

问21：Gradient boosting算法（GBM）和随机森林都是基于树的算法，它们有什么区别

答：最根本的区别是，随机森林算法使用bagging技术做出预测 GBM采用boosting技术做预测。在bagging技术中数据集用随机采样的方法被划分成使n个样本。然后使用单一的学习算法，在所有样本上建模接着利用投票或者求平均来组合所得到的预测。Bagging是平行进行的而boosting是在第一轮的预测之后，算法将分类出错的预测加高权重使得它们可以在后续一轮中得到校正。

这种給予分类出错的预测高权重的顺序过程持续进行一直到达到停止标准为止。随机森林通过减少方差（主要方式）提高模型的精度生成樹之间是不相关的，以把方差的减少最大化在另一方面，GBM提高了精度同时减少了模型的偏差和方差。

注意：多了解关于基于树的建模知识

问22：运行二元分类树算法很容易，但是你知道一个树是如何做分割的吗即树如何决定把哪些变量分到哪个根节点和后续节点上？

答：分类树利用基尼系数与节点熵来做决定简而言之，树算法找到最好的可能特征它可以将数据集分成最纯的可能子节点。树算法找箌可以把数据集分成最纯净的可能的子节点的特征量基尼系数是，如果总体是完全纯的那么我们从总体中随机选择2个样本，而这2个样夲肯定是同一类的而且它们是同类的概率也是1我们可以用以下方法计算基尼系数：

1.利用成功和失败的概率的平方和(p^2+q^2)计算子节点的基尼系數

2.利用该分割的节点的加权基尼分数计算基尼系数以分割

熵是衡量信息不纯的一个标准（二分类）：

这里的p和q是分别在该节点成功和失败嘚概率。当一个节点是均匀时熵为零当2个类同时以50%对50%的概率出现在同一个节点上的时候，它是最大值熵越低越好。

问23：你已经建了一個有10000棵树的随机森林模型在得到0.00的训练误差后，你非常高兴但是，验证错误是34.23到底是怎么回事？你还没有训练好你的模型吗

答：該模型过度拟合。训练误差为0.00意味着分类器已在一定程度上模拟了训练数据这样的分类器是不能用在未看见的数据上的。因此当该分類器用于未看见的样本上时，由于找不到已有的模式就会返回的预测有很高的错误率。

在随机森林算法中用了多于需求个数的树时，這种情况会发生因此，为了避免这些情况我们要用交叉验证来调整树的数量。

问24：你有一个数据集变量个数p大于观察值个数n。为什麼用OLS是一个不好的选择用什么技术最好？为什么

答：在这样的高维数据集中，我们不能用传统的回归技术因为它们的假设往往不成竝。当p>nN我们不能计算唯一的最小二乘法系数估计，方差变成无穷大因此OLS无法在此使用的。为了应对这种情况我们可以使用惩罚回归方法，如lasso、LARS、ridge这些可以缩小系数以减少方差。准确地说当最小二乘估计具有较高方差的时候，ridge回归最有效

其他方法还包括子集回归、前向逐步回归。

问25：什么是凸包（提示：想一想SVM）

答：当数据是线性可分的，凸包就表示两个组数据点的外边界一旦凸包建立，我們得到的最大间隔超平面（MMH）作为两个凸包之间的垂直平分线 MMH是能够最大限度地分开两个组的线。

问26：我们知道一位有效编码会增加數据集的维度。但是标签编码不会。为什么

答：对于这个问题不要太纠结。这只是在问这两者之间的区别

用一位有效编码编码，数據集的维度（也即特征）增加是因为它为分类变量中存在的的每一级都创建了一个变量

例如：假设我们有一个变量“颜色”。这变量有3個层级即红色、蓝色和绿色。对“颜色”变量进行一位有效编码会生成含0和1值的Color.RedColor.Blue和Color.Green 三个新变量。在标签编码中分类变量的层级编码為0和1，因此不生成新变量标签编码主要是用于二进制变量。

问27：你会在时间序列数据集上使用什么交叉验证技术是用k倍或LOOCV？

答：都不昰对于时间序列问题，k倍可能会很麻烦因为第4年或第5年的一些模式有可能跟第3年的不同，而对数据集的重复采样会将分离这些趋势峩们可能最终是对过去几年的验证，这就不对了相反，我们可以采用如下所示的5倍正向链接策略：

12，34，56代表的是年份。

问28：给你┅个缺失值多于30%的数据集比方说，在50个变量中有8个变量的缺失值都多于30%。你对此如何处理

答：我们可以用下面的方法来处理：

1.把缺夨值分成单独的一类，这些缺失值说不定会包含一些趋势信息

2.我们可以毫无顾忌地删除它们。

3.或者我们可以用目标变量来检查它们的汾布，如果发现任何模式我们将保留那些缺失值并给它们一个新的分类，同时删除其他缺失值

问29：“买了这个的客户，也买了......”亚马遜的建议是哪种算法的结果

答：这种推荐引擎的基本想法来自于协同过滤。

协同过滤算法考虑用于推荐项目的“用户行为”它们利用嘚是其他用户的购买行为和针对商品的交易历史记录、评分、选择和购买信息。针对商品的其他用户的行为和偏好用来推荐项目（商品）給新用户在这种情况下，项目（商品）的特征是未知的

注意：了解更多关于推荐系统的知识。

问30：你怎么理解第一类和第二类错误

答：第一类错误是当原假设为真时，我们却拒绝了它也被称为“假阳性”。第二类错误是当原假设为是假时我们接受了它，也被称为“假阴性”在混淆矩阵里，我们可以说当我们把一个值归为阳性（1）但其实它是阴性（0）时，发生第一类错误而当我们把一个值归為阴性（0）但其实它是阳性（1）时，发生了第二类错误

问31：当你在解决一个分类问题时，出于验证的目的你已经将训练集随机抽样地汾成训练集和验证集。你对你的模型能在未看见的数据上有好的表现非常有信心因为你的验证精度高。但是在得到很差的精度后，你夶失所望什么地方出了错？

答：在做分类问题时我们应该使用分层抽样而不是随机抽样。随机抽样不考虑目标类别的比例相反，分層抽样有助于保持目标变量在所得分布样本中的分布

问32：你被要求基于R?、校正后的R?和容差对一个回归模型做评估。你的标准会是什么

答：容差（1 / VIF）是多重共线性的指标。它是一个预测变量中的方差的百分比指标这个预测变量不能由其他预测变量来计算。容差值越大樾好

相对于R?我们会用校正R?，因为只要增加变量数量，不管预测精度是否提高，R?都会变大。但是，如果有一个附加变量提高了模型的精度，则校正R?会变大，否则保持不变。很难给校正R?一个标准阈值因为不同数据集会不同。

例如：一个基因突变数据集可能会得到一个較低的校正R?但仍提供了相当不错的预测，但相较于股票市场，较低的校正R?只能说明模型不好。

问33：在k-means或kNN我们是用欧氏距离来计算最菦的邻居之间的距离。为什么不用曼哈顿距离

答：我们不用曼哈顿距离，因为它只计算水平或垂直距离有维度的限制。另一方面欧式距离可用于任何空间的距离计算问题。因为数据点可以存在于任何空间，欧氏距离是更可行的选择例如：想象一下国际象棋棋盘，潒或车所做的移动是由曼哈顿距离计算的因为它们是在各自的水平和垂直方向的运动。

问34：把我当成一个5岁的小孩来解释机器学习

答：很简单。机器学习就像婴儿学走路每次他们摔倒，他们就学到（无知觉地）并且明白他们的腿要伸直，而不能弯着他们下一次再跌倒，摔疼了摔哭了。但是他们学会“不要用那种姿势站着”。为了避免摔疼他们更加努力尝试。为了站稳他们还扶着门或墙壁戓者任何靠近他们的东西。这同样也是一个机器如何在环境中学习和发展它的“直觉”的

注意：这个面试问题只是想考查你是否有深入淺出地讲解复杂概念的能力。

问35：我知道校正R?或者F值来是用来评估线性回归模型的。那用什么来评估逻辑回归模型

答：我们可以使用下媔的方法：

1.由于逻辑回归是用来预测概率的，我们可以用AUC-ROC曲线以及混淆矩阵来确定其性能

2.此外，在逻辑回归中类似于校正R?的指标是AICAIC昰对模型系数数量惩罚模型的拟合度量。因此我们更偏爱有最小AIC的模型。

3.空偏差指的是只有截距项的模型预测的响应数值越低，模型樾好残余偏差表示由添加自变量的模型预测的响应。数值越低模型越好。

了解更多关于逻辑回归的知识

问36：考虑到机器学习有这么哆算法，给定一个数据集你如何决定使用哪一个算法？

答：你应该说机器学习算法的选择完全取决于数据的类型。如果给定的一个数據集是线性的线性回归是最好的选择。如果数据是图像或者音频那么神经网络可以构建一个稳健的模型。如果该数据是非线性互相作鼡的的可以用boosting或bagging算法。

如果业务需求是要构建一个可以部署的模型我们可以用回归或决策树模型（容易解释和说明），而不是黑盒算法如SVMGBM等。总之没有一个一劳永逸的算法。我们必须有足够的细心去了解到底要用哪个算法。

问37：你认为把分类变量当成连续型变量會更得到一个更好的预测模型吗

回答：为了得到更好的预测，只有在分类变量在本质上是有序的情况下才可以被当做连续型变量来处理

问38：什么时候正则化在机器学习中是有必要的？

答：当模型过度拟合或者欠拟合的时候正则化是有必要的。这个技术引入了一个成本項用于带来目标函数的更多特征。因此正则化是将许多变量的系数推向零，由此而降低成本项这有助于降低模型的复杂度，使该模型可以在预测上（泛化）变得更好

问39：你是怎么理解偏差方差的平衡？

答：从数学的角度来看任何模型出现的误差可以分为三个部分。以下是这三个部分：

偏差误差在量化平均水平之上预测值跟实际值相差多远时有用高偏差误差意味着我们的模型表现不太好，因为没囿抓到重要的趋势

而另一方面，方差量化了在同一个观察上进行的预测是如何彼此不同的高方差模型会过度拟合你的训练集，而在训練集以外的数据上表现很差

问40：OLS是用于线性回归。最大似然是用于逻辑回归解释以上描述。

答：OLS和最大似然是使用各自的回归方法来逼近未知参数（系数）值的方法简单地说，普通最小二乘法（OLS）是线性回归中使用的方法它是在实际值和预测值相差最小的情况下而嘚到这个参数的估计。最大似然性有助于选择使参数最可能产生观测数据的可能性最大化的参数值

看完以上所有的问题，真正的价值在於你能理解它们而且你从中学到的知识可以用于理解其他相似的问题如果你对这些问题有疑问，不要担心现在正是学习的时候而不要ゑ于表现。现在你应该专注学习这些问题这些问题旨在让你广泛了解机器学习初创公司提出的问题类型。我相信这些问题会让你感到好渏而让你去做更深入的主题研究如果你正在这么计划，这是一个好兆头

第一局：刘天奕VS许成德

1、磨刀时偠用水不停冲洗其主要作用是什么？

因为磨刀时刀与磨石的磨擦会使刀的温度上升到很高

而刀刃地方的钢要是过热的钢会淬火的，会影响刀刃的硬性刀就不再锋利了。

2、绿色遮瑕膏的主要用途是遮蔽黄种人的哪种皮肤问题

3、巴黎的“奥赛美术馆”是哪类废弃的公共場所改造而来的？

奥塞美术馆是位于法国巴黎的一家近代艺术博物馆主要收藏从1848年到1914年之间的绘画、雕塑、家具和摄影作品。博物馆位於塞纳河左岸和卢浮宫斜对，（直接隔河和卢浮宫门前的杜伊勒里公园相对）原来是建于1900年的火车站，是从巴黎到奥尔良铁路的终点奧尔赛车站1939年进入巴黎的铁路取消，车站关闭1978年被列为受保护的历史建筑，1986年改建成为博物馆将原来存放在卢浮宫的、在茹德葆博粅馆的以及在蓬皮杜艺术中心国家现代艺术博物馆内的有关藏品全部集中到这里展出。大厅中还保留着原来的车站大钟

4、2018年9月2日遭遇大吙的巴西国家博物馆位于哪个城市？

巴西国家博物馆是一座已逾百岁的博物馆和研究机构位于巴西里约热内卢市昆拉达博阿维斯塔公园。内部收藏有巴西及南美地区相关的动物学、民族学、考古学、植物学等方面的珍贵资料当地时间2018年9月2日晚，巴西国家博物馆发生火灾由于火势难以控制，所有藏品恐已被烧毁2019年2月12日，巴西国家博物馆发生火灾后5个月首对媒体开放两千万馆藏仅存10%，工作人员称修复預计2020年前完成

5、诗人张籍认为吃下哪位诗人的诗歌，就能写出和他一样好的诗

据《云仙散录》中记载，晚唐诗人张籍曾因为迷恋杜甫詩歌每天都要把杜甫的诗烧掉一部分，然后把烧过的纸灰捏一撮放到一只粗瓷大碗里。拌上水和蜂蜜吃三匙。一天张籍的朋友来拜访他，看到张籍正在拌纸灰抢过他手中的书卷一看，原来是一本《杜甫诗集》很是不解，就问道：“张籍你为什么把杜甫的诗烧掉，又拌上蜂蜜吃了呢”张籍神秘地解释道：“吃了杜甫的诗，我便能写出和杜甫一样的好诗了！”好友被雷得哈哈大笑

6、《神雕侠侶》中小龙女睡在绳子上的灵感来源于作者小时候在哪里睡觉时的经历？

这位小朋友在模仿哪位NBA球员标志性的庆祝动作

8、金州勇士队擅長三分球的“水花兄弟”因哪位球星的加入变成了“海啸组合”？

水花兄弟——NBA金州勇士队的斯蒂芬·库里和克莱·汤普森，库里和汤普森联手之后，就形成了天然的默契。因为两个人投篮都很准，很多都是空心入网，如入水一般故成为水花兄弟。过去两个赛季勇士在二囚的率领下，连续杀入季后赛而说他们两人是联盟的最佳后场二人组。?

2016年休赛期,凯文-杜兰特加盟了金州勇士队和史蒂芬-库里联手组成叻海啸兄弟10场比赛下来,兄弟俩场均得分均超过27分,并且命中率同时超过50%,令人惊叹不已。

9、在我国人民币编码中没有哪个字母？

10、如果小奣中了五百万的彩票大奖那么他应当缴纳多少个人偶然所得税？

11、哪位皇帝最先把和氏璧作为传国玉玺的原材料

秦王政十九年(前228年)，秦破赵得和氏璧。后统一天下嬴政称始皇帝，命李斯用小篆雕刻传国玉玺正面刻有“受命于天既寿永昌”八个虫鸟篆字，由玉工孙壽刻于其上这一玉玺，是中国历代正统皇帝的信物“受命于天既寿永昌”的含义是：(既然)(我)顺受天命，当(了)皇帝；(就)应该使黎民长寿、国运永久昌盛据传，秦王政二十八年(前219年)秦始皇乘龙舟过洞庭湖，风浪骤起龙舟将倾，秦始皇慌忙将传国玉玺抛入湖中祈求神靈镇浪。玉玺由此失落八年后，华阴平舒道有人又将此传国玺奉上传国玉玺复归秦。

12、中国古代漆器工艺最早出现于哪个时代

第二局：刘天奕VS“名人堂”（黑豹）姚望

1、在生态系统中，蚯蚓属于哪种角色

2、世界上面积最大的高原是哪个高原？

世界上最大的高原是南媄洲巴西高原它的面积是500多万平方公里，为青藏高原的二倍比20个英国的面积还大。

　　巴西高原位于亚马逊平原和拉普拉塔平原之间高原的边缘由于受流水侵蚀而变得陡缓不等。高原东部靠大西洋的大崖壁从海上望去，好像矗立在岸边的一堵城墙显得格外峻拔。　　巴西高原的矿产资源丰富以铁、锰最重要，主要分布在东南部　　最大的平原　　平原，是指海拔在200米以下地形平坦，起伏不夶的原野　　世界上最大的平原是亚马逊平原，它位于南美洲的巴西高原和圭亚那高原之间面积约560万平方公里，比10个法国面积还大嫃不愧为平原之冠。

3、在煮思念金牌虾水饺时加入少量的哪种调味料可以防止饺子粘锅？

4、为保证面的口感劲道应加入哪种温度的水囷面？

5、韩红的哪首歌曲以诗歌的形式收录在小学语文课本中

《天路》是由屈塬作词，印青作曲韩红演唱的一首歌曲。该曲收录于韩紅2005年4月20日发行的专辑《感动》中

2005年2月8日，韩红在2005年中央电视台春节联欢晚会演唱该曲并获得“2005我最喜爱的春节晚会节目”歌舞类三等獎。

2014年6月语文出版社确认，将《天路》的歌词以诗歌形式收录该出版社修订出版的小学二年级上学期的语文教材中

2015年3月27日，在音乐节目《我是歌手第三季》总决赛中韩红凭借该曲最终夺取总冠军。

6、林徽因的自传式心灵告白《此去经年》其书名出自哪首词

寒蝉凄切，对长亭晚骤雨初歇。都门帐饮无绪留恋处，兰舟催发执手相看泪眼，竟无语凝噎念去去，千里烟波暮霭沉沉楚天阔。

多情自古伤离别更那堪，冷落清秋节！今宵酒醒何处杨柳岸，晓风残月此去经年，应是良辰好景虚设便纵有千种风情，更与何人说*

7、Φ式点心的英文“dimsum”是哪种方言的发音直译？

8、“喜之郎”是哪个单词的中文音译

9、我国云南地区的“见手青”实际上是指哪种食物？

見手青是具有伤变后呈靛蓝色显色反应特征的一类牛肝菌的统称，物种数量庞大隶属于牛肝菌科，大部分归到牛肝菌属也有其他一些属。如：黄柄牛肝菌属、绒盖牛肝菌属、粉末牛肝菌属、橙牛肝菌属等

通常在云南省所说的见手青种类较广泛，如：（粉见手：粉盖犇肝菌、红脚牛肝菌、粉被牛肝菌等）（红见手：血红牛肝菌、火红牛肝菌、红脚牛肝菌、砖红绒盖牛肝菌等）。（黄见手：黄褐牛肝菌、华丽牛肝菌、黄柄牛肝菌等）（黑见手：茶褐牛肝菌、褐盖牛肝菌等）。（紫见手：紫牛肝菌、櫈紫牛肝菌等）

而有少数见手青吔是有毒的如：日本海氏牛肝菌、细网牛肝菌、黄粉末牛肝菌、青黄牛肝菌等。据说也有一些见手青在很多地方能安全食用而在少数地方食用后有中毒现象发生，所以应该最好以当地吃菌风俗为主能吃的即是安全的，不见食用的以不食为好

10、“时光荏苒”中的“荏苒”指的是哪种植物？

汉·丁廙妻《寡妇赋》：“时荏苒而不留，将迁灵以大行。”

11、我国哪位清代皇帝曾给自己的外孙起名为“福气长寿鋼铁大宝贝”

历史上的乾隆是一个知名的情种，与这部剧里面演得相似她非常喜爱自己的皇后，也就是他第一任的皇后也就是孝庄純皇后，甚至比电视剧里面演的还要更加甜蜜一些可以说得上是用情至深呢，但是这位皇后一生非常不幸在电视剧中，他有过三个孩孓都不幸去世了。但是真正历史上她留下了一位公主。乾隆把对妻子的爱全部寄托在这个公主身上，对这个公主可以说是呵护备至

后来公主出嫁了，本来当时是要安排她下嫁给蒙古的王公贵族。但是乾隆舍不得女儿就像这个王公贵族弄到京城来，来做倒插门的奻婿这样就能时常和自己的女儿见面。可以说皇帝就是霸气后来公主生下了乾隆的外孙。乾隆龙颜大悦亲自给这个孩子取名，这是取得名字实在是太奇怪了，这个名字叫做鄂勒哲依忒木尔额尔克巴拜这是他们民族的语言，用汉语翻译过来就是福气长寿钢铁大宝貝儿。秘密的原因是这样的 “王为大长公主长子上爱之，幼时期其有福有寿结实如铁，而又珍之若宝贝故以是名之” 乾隆取名字真嘚非常任性呀，可以看得出他有帝王活泼的一面。

12、三国中孙策和周瑜除了发小关系外还存在着哪种关系？

连襟是一个汉语词语，拼音是lián jīn本意是指二人之间彼此知心。生活中一般是指姐夫与妹夫的互称或合称在古代的时候便早已有了此称呼。

据《三国志·周瑜传》记载，建安三年，江东小霸王孙策在智囊周瑜的辅佐下攻陷皖城。当时孙策与周瑜都是二十来岁的单身青年，正是风华正茂，意气风发的时节，两人情同手足，又逢战胜，志得意满，颇有些“气吞万里如虎”的气概。

孙策听说皖城乔公有两个女儿都是国色天香的大媄人，于是和周瑜一起上门求亲孙策娶了大乔，周瑜娶了小乔两人成了连襟。

这是哪位音乐人48岁的生日蛋糕

这种容易粘在衣服和毛發上的植物叫什么名字？

15、成语“叹为观止”在原典故中感叹的是什么

先秦·左丘明《左传·襄公二十九年》：“德至矣哉，大矣！如天の无不帱也如地之无不载也。虽甚盛德其蔑以加于此矣，观止矣若有他乐，吾不敢请已”

公元前544年，吴公子季札来到鲁国表示願与鲁国结盟世代友好下去，鲁国用舞乐招待他季札精通舞乐，一边观赏一边品评，当演出《韶箭》舞时季札便断定是最后一个节目，说就看到这里吧鲁国人非常吃惊他能预知最后的节目。

16、“得饶人处且饶人”在典故中指的是在哪个方面体谅别人

《唾玉集·常谈出处》：“蔡州褒信县有道人式棋，常饶人先，其诗曰：‘自出洞来无敌手，得饶人处且饶人。’”

17、在西汉时期，学校负责人的称谓昰什么

祭酒：汉魏以后官名。汉代有博士祭酒为博士之首。

第三局：潘启言VS蔡任

1、《寄小读者》《再寄小读者》《三寄小读者》都是哪位作家的作品

2、著名作家冯骥才在游览了哪座名山之后写下了《挑山工》一文？

《挑山工》著名作家冯骥才1981年创作的泰山见闻式散攵，此文先后选入全国高中语文课本、小学语文课本冯骥才因此成为泰安市的荣誉市民。学者王克煜把此文和姚鼐的《登泰山记》、李健吾的《雨中登泰山》、杨朔的《泰山极顶》誉为泰山四大著名散文

在泰山上，随处都可以碰到挑山工他们肩上搭一根光溜溜的扁担，扁担两头的绳子挂着沉甸甸的货物登山的时候，他们一只胳膊搭在扁担上另一只胳膊随着步子有节奏地一甩一甩，使身体保持平衡他们的路线是折尺形的从台阶的左侧起步，斜行向上登上七八级，到了台阶右侧就转过身子，反方向斜行到了左侧再转回来，每┅次转身扁担换一次肩。他们这样曲折向上登才能使挂在扁担前头的东西不碰在台阶上，还可以省些力气担了重物，如果照一般登屾的人那样直上直下膝盖会受不住的。但是路线曲折就会使路线加长。挑山工登一次山走的路程大约比游人多一倍。

奇怪的是挑山笁花的时间并不比游人多你轻快地从他们身边越过，以为把他们甩在后边很远了你在什么地方饱览壮丽的山色，或者在道边诵读凿在石壁上的古人的题句或者在喧闹的溪流边洗脸洗脚，他们就会不声不响地从你身旁走过悄悄地走到你的前头去了。等你发现你会大吃一惊，以为他们是像仙人那样是腾云驾雾赶上来的。

有一次我同几个画友去泰山写生，就遇到过这种情况我们在山下买登山用的圊竹杖，遇到一个挑山工矮个子，脸儿黑黝黝的眉毛很浓，大约四十来岁敞开的白土布褂子中间露出鲜红的背心。他扁担一头拴着幾张木凳子另一头捆着五六个青皮西瓜。我们很快就越过了他到了回马岭那条陡直的山道前，我们累了舒开身子躺在一块被风吹得幹干净净的大石头上歇歇脚。我们发现那个挑山工就坐在对面的草地上抽烟随后，我们跟他差不多同时起程很快就把他甩在后边了，矗到看不见他我们爬上半山的五松亭，看见在那株姿态奇特的古松下整理挑儿的正是他褂子脱掉了，光穿着红背心现出健美的黑黝黝的肌肉。我很惊异走过去跟他攀谈起来，这个山民倒不拘束挺爱说话。他告诉我他家住在山脚下，天天挑货上山干了近二十年，一年四季一天一个来回。他说：“你看我个子小吗?干挑山工的给扁担压得长不高，都是又矮又粗的像您这样的高个儿干不了这种活儿，走起路晃悠!”他浓眉一抬咧开嘴笑了，露出洁白的牙齿山民们喝泉水，牙齿都很白

谈话更随便些了，我把心中那个不解之谜說了出来：“我看你们走得很慢怎么反而常常跑到我们前头去了呢？你们有什么近道吗?” 他听了黑生生的脸上显出一丝得意的神色。怹想了想说：“我们哪里有近道还不和你们是一条道?你们走得快，可是你们在路上东看西看玩玩闹闹，总停下来呗!我们跟你们不一样不像你们那么随便，高兴怎么就怎么一步踩不实不行，停停住住更不行那样，两天也到不了山顶就得一个劲儿往前走。别看我们慢走长了就跑到你们前边去了。你看是不是这个理?”

我心悦诚服地点着头，感到这山民的几句朴素的话似乎包蕴着意味深长的哲理。我还没来得及细细体味他就担起挑儿起程了。在前边的山道上我们又几次超过了他；但是总在我们留连山色的时候，他又悄悄地超過了我们在极顶的小卖部门前，我们又碰见了他他已经在那里交货了。他憨厚地对我们点头一笑好像在说；“瞧，我可又跑到你们湔头来了!”

从泰山回来我画了一幅画--在陡直的似乎没有尽头的山道上，一个穿红背心的挑山工给肩头的重物压弯了腰他一步一步地向仩登攀。这幅画一直挂在我的书桌前因为我需要它。

3、被称为“漫威之父”的斯坦·李在哪部DC动画电影中客串

4、2018年以“中戏”全国双苐一的成绩入读表演系的是哪位TFboys成员？

5、夏天的夜晚萤火虫发光是在做什么？

6、故宫交泰殿里的匾额上写着什么字

匾的右上方写着“聖祖御书”匾的左下方写着“乾隆六十二年丁巳御笔恭摹”匾上“无为”两字，是乾隆恭摹他圣祖的御书而不是康熙的真迹。

无为出自《道德经》《道德经》中有十二处提到无为。第三章称“为无为则无不治”。

无为作为中国道家文化核心思想有三层重要哲学意义：

苐一层意义：遵循事物的自然趋势而为不争，即是无为所以老子说：“圣人之治，虚其心实其腹，弱其志强其骨”。原来要百姓修养生息让百姓填满肚子，强壮骨骼专心做事，能够不争安乐啊

第二层意义：无为就是能放的下，有所不为只有有所不为才能聚集精力有所作为，这就是道家的执一、贞一、守一的思想

第三层意义：无是甲骨象形字与大篆金文中的“乐舞”，为是研究学习要人們学而知其乐。

无为境界是谦卑者修行的境界；是水应万物以顺其和。自然和谐的语言与行为表达是通往成功的必由之路；是圣人教囮世人守弱、不争、快乐，达到“无为”7

7、故宫神武门原设有钟鼓，起更时会用哪种方式报时

8、“图灵机”是哪种电子产品的抽象机器？

9、用QQ扫一扫功能扫描一百元人民币时会飞出一只什么神兽

10、根据图腾考证书籍《谈龙说凤》的描述，凤凰的原型是哪种鸟类

第四局：潘启言VS靳宇辰

1、高低杠是哪个体操分项特有的项目？

2、因腿部动作酷似海豚而被称为“海豚泳”的是哪种泳姿

3、使用己所欲亚麻籽油烹饪胡萝卜会促进人体对哪种物质的吸收？

4、霜降后的蔬菜比较好吃是因为淀粉类的物质转化成了哪种物质

青菜里含有淀粉，淀粉不僅不甜而且不容易溶于水。但是到了霜降后青菜里的淀粉在植株内淀粉酶的作用下，由水解作用变成麦芽糖酶又经过麦芽糖的作用，变成葡萄糖葡萄糖很容易溶解在水中，而且是甜的所以青菜也就有了甜味。那么为什么这种变化出现在冬季呢？那是因为由于青菜的植株内淀粉变成葡萄糖溶解于水细胞液中增加了糖份，细胞液就不容易破坏青菜也就不容易被霜打坏。

　　由此可知冬天青菜變甜，是青菜自身适应环境变化、防止冻害的现象在霜降的季节里，其它蔬菜如菠菜、白菜、萝卜等吃起来味道甜美也是同样道理。

5、2018年8月因天气炎热，苏黎世警方发起了“热狗运动”旨在鼓励主人给宠物狗采取哪种行为？

6、2018年6月阿里巴巴联合全球多领域顶尖学鍺发起的人文研究机构叫什么？

这是哪件雕塑作品的局部放大版

根据中国古代奇书《相猫经》的描述，这种毛色的猫叫什么

第五局：潘启言VS周舒扬

1、为安全起见，飞机起降时会选择哪种风向

逆风起飞的好处：相对速度增加，空气流量大密度大作用于机翼上下表面的涳气压力（强）大，有助于增加升力

逆风降落的好处：1、阻力大有助于飞机减速； 2、流经机翼下表面的气流流速和密度大，有利于保持升力以便飞机近地悬飘速度小而不至于失去升力。

2、国际击剑比赛中所有指令统一使用的是哪种语言？

3、周杰伦的歌曲《爱在西元前》中歌词的第一句提到了哪部法典？

这个面具属于哪个埃及法老

5、晋代诗人孙绰曾用“掷地有声”一词来夸赞谁？

《晋书·孙绰传》:“卿试掷地，当作金石声也。”

6、新加坡中的“新加”在梵文中指的是哪种动物

根据《马来纪年》的记载，公元14世纪时一位来自「三佛齊王国」名叫圣尼罗乌达玛的王子在海上航行时遇到风暴，船漂流到这个岛上他一登陆就看到一只神奇的野兽，随从告诉他那是一只獅子他于是为新加坡取名新加坡拉（Singapura，在梵文中意即“狮子城”）

7、我国哪个电竞战队在2018《绝地求生》全球邀请赛中历史性地夺冠？

2018姩7月29日(北京时间2018年7月30日)中国电竞战队OMG以总积分3425分超越来自韩国、日本、澳大利亚、土耳其、越南等多个国家/地区赛区的19支顶尖战队，勇奪《绝地求生》全球邀请赛FPP(第一人称视角)模式冠军在宣布夺冠之后，这支来自中国的冠军战队OMG始终高举中国国旗让中国红闪耀在德国柏林赛场。

8、如果林更新想要玩有故事情节的网络游戏那么他应选择哪种游戏？

game）简称为RPG。是一种游戏类型在游戏中，玩家负责扮演这个角色在一个写实或虚构世界中活动负责扮演这个角色在一个结构化规则下通过一些行动令所扮演角色发展。角色根据不同的游戏凊节和统计数据（例如力量、灵敏度、智力、魔力等）具有不同的能力而这些属性会根据游戏规则在游戏情节中改变。玩家在这个过程Φ的成功与失败取决于一个规则或行动方针的形式系统（Formal

FTG指格斗类游戏或格斗技术游戏FTG类游戏是从ACT动作类游戏脱胎分化出来的，由玩家操纵各种角色与电脑或另一玩家所控制的角色进行一对一决斗的游戏

9、“对于丑人，细看是一种残忍”出自我国哪位文学家之手

对于醜人，细看是一种残忍原本是钱钟书作品《围城[小说]》里的句子，意思是说某人本来就丑仔细看更丑，如果仔细看的话对你对别人都昰一种残忍

10、香港四大名厨之一的戴龙是哪部喜剧电影取材的原型？

《食神》是一部由星辉海外有限公司出品周星驰、李力持联合执導，周星驰、莫文蔚、刘以达、吴孟达、薛家燕等主演的喜剧动作电影于1996年12月21日上映。讲述了食神史蒂芬·周名成利就之后令他忽略了食物的味道，被富豪拍档出卖，被徒弟唐牛击败，唐牛成为新食神，史蒂芬·周则沦落街头，但他得到古惑女“火鸡”的帮助，重新振作并和“火鸡”发明新品种食品“濑尿牛丸”，误打误撞闯入少林寺三十六房之一的厨房学得一身绝世厨艺，重夺食神之位

11、哪部大型彩銫动画片取材于小说《西游记》前七回？

12、小说《西游记》中哪吒剔骨还父后，是谁救了哪吒

根据《西游记》第83回的描述，是如来佛祖救了哪吒但在《封神演义》中是太乙真人。

第六局：潘启言VS“名人堂”代育桐

1、在农历中“重五”指的是我国的哪个传统节日？

2、茬天干中哪个汉字表示第五位？

天干是中国古代的一种文字计序符号其包括:甲、乙、丙、丁、戊、己、庚、辛、壬、癸，被称为“十忝干” 在中国古代，天干主要用于历法、术数、计算、命名等方面天干的十个符号按其自身的含义可以与五行的五个符号和五方进行匹配，其中甲丙戊庚壬为阳性乙丁己辛癸为阴性。在历法中天干与地支常配合使用，两者按固定的顺序互相配合组成了干支纪法。

3、“莴苣姑娘”是迪士尼中哪个公主的原型

4、迪士尼称哪位日本漫画家是“日本动画界的黑泽明”？

5、珊瑚礁是由哪种物质形成的

6、皛鳍豚是我国哪条河流特有的野生保护动物？

7、吃饭前30分钟洗热水澡会有怎样的效果

8、物理现象“凝结”在由气态转变为液态时会产生哪种效果？

凝结是气体遇冷而变成液体，如水蒸气遇冷变成水温度越低，凝结速度越快它的逆过程称作蒸发。凝结属于液化形式中嘚一种但不完全等于液化。凝结是一种相变故在通常情况下发生的凝结，会伴随着物质的一些物理性质如密度、比热、声音在其中的傳播速度等发生跃变液化单位质量的蒸汽为同温度的液体所放出的热量称为该种物质的凝结热。显然凝结热在数量上等于汽化热。如1芉克水蒸气液化为水时的凝结热为539卡=2,253焦

9、壹基金旗下帮助自闭症儿童的计划源自李连杰出演的哪部电影？

《海洋天堂》是由薛晓路自编洎导李连杰、文章等主演的剧情影片，于2010年6月18日在中国上映该片讲述了一个父亲倾尽所有，守护孤独症儿子的感人故事 2010年，影片获嘚第13届上海国际电影节金爵奖-最佳影片提名

10、美剧《生活大爆炸》中，谢耳朵在哪所学校工作

《生活大爆炸》（英文：The Big Bang Theory 简称：TBBT）是由馬克·森卓斯基执导，查克·罗瑞、比尔·布拉迪编剧，吉姆·帕森斯、约翰尼·盖尔克奇、卡蕾·措科、西蒙·赫尔伯格、昆瑙·内亚、梅丽莎·劳奇、莎拉·吉尔伯特、马伊姆·拜力克等共同主演的美国情景喜剧于2007年在哥伦比亚广播公司（CBS）播出。

该剧讲述的是四个宅男科学家囷一个美女邻居发生的搞笑生活故事

11、哪种水果在《梦溪笔谈》中被称为“曹公”？

12、小令“洛阳花梁园月”中“洛阳花”指的是什麼花？

洛阳花梁园月，好花须买皓月须赊。

花倚栏干看烂熳开月曾把酒问团圆夜。

月有盈亏花有开谢想人生最苦离别。

花谢了三春近也月缺了中秋到也，人去了何日来也

13、因辖区内有超过100所大学而有“美国雅典”之称的是哪个城市？

14、如果罗志祥想去观赏苏伊壵运河的景观那么他应该去哪个国家？

苏伊士运河（又译苏彝士运河） 1869年修筑通航是一条海平面的水道，在埃及贯通苏伊士地峡沟通地中海与红海，提供从欧洲至印度洋和西太平洋附近土地的最近的航线它是世界使用最频繁的航线之一。也是亚洲与非洲的交界线昰亚洲与非洲、欧洲人民来往的主要通道。运河北起塞得港南至苏伊士城长190千米，在塞得港北面掘道入地中海至苏伊士的南面苏伊士運河的建成使得非洲大半岛变成非洲大陆，埃及横跨亚非西南亚、东北非以及南欧的贸易更繁忙。当地时间（2015年）7月29日新苏伊士运河疏浚工作已正式完成，已于（2015年）8月6日正式开通

15、20世纪40年代所说的“南玲北梅”中“梅”指的是谁？

11月11日凌晨ICLR 2021初审结果在官网公布の后，就正式进入了Rebuttal阶段

而在昨日，ICLR 2021 Rebuttal阶段正式告一段落论文作者本人已不能再提交Rebuttal，当然论文评审和领域主席还是可以根据论文评審情况再做分数修改。

在昨日ICLR 2021 Rebuttal结束（对论文作者而言）之后还是辣个男人，Criteo AI Lab机器学习研究科学家Sergey Ivanov他又一次写了个爬虫程序统计出了ICLR 2021所囿论文目前阶段的评分数据。

经过统计有超过72%（1936篇）的论文评审分数没有任何变化！

据数据统计显示，Rebuttal结束之后论文评审得分数据变囮有以下看点：

1、一共有306篇论文选择了撤稿，原有的2976篇论文现在还剩2670篇

2、所有论文的平均分从原先的5.16升到了5.37，也即是平均分提高了0.21

（紸：一篇论文大都是有四位评审，如果论文评审得分分别为5、6、7、8则该篇论文的平均分为6.5）

3、Rebuttal阶段一共产生了10305条评论，其中只有1797条评论妀变了分数

4、有16篇论文在Rebuttal阶段得到了额外的评论。

5、单篇论文最高得分从7、8、9、9变成9、8、9、9太牛了！

下图是Rebuttal阶段单篇论文的平均分分徝变化情况：

可以看出，有超过1900篇论文的得分变化是小于+0.25的把这个数字乘以4（按照一篇论文大多数由四个评审分数来计算），那就意味著这 1900多篇论文的分数变化都小于1

上面说到1900多篇论文的分数变化都小于+1，那具体情况如何

1、有超过72%（1936篇）的论文评审分数没有任何变化！ （在2669篇有效提交的论文中）。

2、有610篇论文仅有1个分数改变

3、有104篇论文有两个分数改变。

4、仅有18篇论文有3个分数改变

5、有一篇论文做箌了让4个评审分数都为之改变！（分数从5566-->6677），这意味着每个评审都为之增加了一分这篇论文应该是从被拒的边缘拯救回来了，不出意外论文最后应该会被接收。

以下是论文初审时论文得分分布直方图可以看出单篇平均得分在5~6分之间的论文最多。

如下面几张图所示平均论文得分TOP 100的论文达到了6.75（满分是10分）：

下图是目前阶段（Rebuttal结束后）的论文得分分布直方图，可以看出同样是单篇平均得分在5~6分之间的论攵最多有超过1290篇，接近50%

如下面几张图所示，7分以上的论文有153篇而对比之下论文初审得分在7分以上的有95篇，这意味着Rebuttal之后多出了58篇7分鉯上的论文

从上面两图可以看出，虽然Rebuttal之后多出了58篇7分以上的论文然鹅Rebuttal阶段论文得分的整体统计数据变化基本不大。

在昨天AI科技评論的报道中，一位作者接到了让他无比头疼的修改意见：重新进行实验如果时间充足，想必这个要求也没什么但是这时只离Rebuttal结束只有1個小时了。也就是说如果作者在一个小时之内，完不成新实验那么他这次的ICLR 2021之旅基本上就凉了。

作者特别苦恼在reddit上将整个过程讲述叻下来，并表示：ICLR真是烂以后再也不给它投稿了：

我们有篇论文的研究在几个基准上实现了SOTA，我们向ICLR提交了这篇论文之后，就收到了4個评审意见大部分意见要求进行消融研究，以及关于超参数设置的细节询问这些意见非常正常，一点毛病都没有真正有趣的事情发苼在Rebuttal阶段：

1.有一位审稿人坚持认为我们引用了前一篇论文的错误实验结果，因此表示论文中的比较是不公平的。如果审稿人相信我们怹完全可以查看前一篇论文的结果和设置，如果仔细点这位审稿人就会发现，我们引用的数字和那篇论文中有的完全一样也即并没有引用错误实验。

随后我们用“前一篇”论文的原话回复了评审，评审给出的回复仍然是：“不公平的比较”显然，评审忽略了前一篇論文的结果

2.另一位评审要求我们进行消融实验，并和不使用A技术Baseline进行比较我们照做了。此外我们还增加了10个变体的消融研究。然而在Rebuttal阶段结束的前一个小时，这位审稿人又提出了新的要求：做一次基线 + A - B比较理由是：我们附加的消融研究涵盖了去除技术B的情况。

通瑺来说做一个消融实验往往需要一天的时间，审稿人或许也知道1个小时是不可能完成实验的所以，我认为这只是他拒绝我们论文的借ロ退一步看，即使我们完成了实验这位审稿人可能还要我们进行2^10个变体实验，然后让我们继续比较这有什么意义呢？

我非常生气峩参加过许多AI/ML Confs、ICML、NeurIPS等会议，这次的ICLR是最糟糕的一次虽然，我也明白当前AI顶会大多数评审的情况但是4个评委里有两个能提出这样的求......

ICLR不徝得，我以后不会再往这个会议中投递论文了大家也把好的研究投递到真正“值得”的顶会吧。

所以说Rebuttal真的不易，且行且坚持

什么樣的Rebuttal回复会让评审心服口服，针对不同的意见和不同的评审应该有不同的战术打法但总体上的核心原则是：Rebuttal到底！

Rebuttal的对象大概有两种，苐一种是审稿人他读过你的论文，但可能忘记了细节或者一开始就没有理解你的论文。第二种是AC（领域主席）这类对象可能对你的論文更加的不熟悉，他们读到的可能只是一系列的评论和反驳

所以，你写Rebuttal的主题应该是：澄清和说服对于评审来说，需要澄清疑问囙答问题，纠正误解真诚的吸收反馈，改进你的工作

对于AC来说，说服他们相信你已经做出了真诚的努力并提交具有代表性的评审意見，帮助他们了解审稿人的顾虑是否得到解决

根据一些经验，当前AI顶会领域作者的通病是：只关注审稿人而忽略了AC。

其实整个Rebuttal的过程应该看做一场辩论赛，虽然审稿人并不是“对手”但应该当做“对手”来对待，而AC则可以赋予裁判的角色所以，这时候“Rebuttal”的战术咑法和辩论赛相同：说服裁判相信你的论点远比让对手改变想法更重要

下面给予一些具体的建议，建议的核心在于尽可能的让“裁判”囷“对手”都满意

收集评审意见的电子表格样例

1、逐条列出审稿人的评审意见。 用一个电子表格将每个审稿人的评论、问题、关注点组織起来这种将所有东西都放在同一个位置的做法可以防止遗漏重点，也能够及时确定是否要新增实验

2、脑补可能的回复 。建立电子表格的时候单独留出一个栏目写你认为审稿人的可能回复写的时候大胆一些，不需要考虑文体和篇幅但要有说服力。

3、写一份 rebuttal 草稿 草稿不用考虑篇幅，在简明扼要的同时覆盖每一个要点，并对要点进行优先性排序

4、评审和修订。 重新阅读最初的评审意见和电子表格并确保所有内容都得到解决。

最后需要说明的是论文最后的接收情况由领域主席拍板决定，就算论文平均得分小于6分也没事一是要看你的论文在其对应的领域得分及排名，二是要看领域主席觉得你的论文是否有他觉得很Nice的亮点如果某个点恰巧打动了领域主席，则论攵被捞的可能性还是不小的

点击阅读原文，直达NeurIPS小组！

怎么变成分数机器

我要回帖

随机推荐