2021年百度数据挖掘工程师面试题
小编:管理员 1135阅读 2021.06.17
简答(30分)
1.【C/C++】Const作用于变量、函数、类分别有什么特性(10分)
2.内存分配中堆和栈的区各是什么?在什么时候回忆分配?(10分)
3.如何判定训练处的模型过拟合?(10分)
算法与程序设计题(45分)
1.假设有一个数组,里面有10个元素inta[10]={0,1,2,3,4,5,6,7,8,9},请写一个算法,得到a数组的一个随机排列,要求时间复杂度尽量小,可以使用random函数,例如输出的随机序列可以使:3 6 2 4 5 1 8 9 0 (15分)
2.对于logistic regession 问题(prob(t|x)=1/(1+exp(w*x+b))且labely=0或1)请给出loss function和权重w的更新公式及推导(15分)
系统设计题
假设我们有3个箱子,分别是红色,蓝色和绿色,在红色箱子中有3个苹果,4个橘子,3个柠檬,在蓝色箱子中有1个苹果,1个橘子和0个柠檬,在绿色箱子中有3个苹果,3个橘子和4个柠檬。如果我们选择箱子的概率是红色0.2,蓝色0.2,绿色0.6,并且选择一个箱子后,以均匀的概率随机移除一个水果,那么移除苹果的概率是多少?请给出步骤(10分)
如果我们发现移除的水果是橘子,那么这个橘子来自绿色箱子的概率是多少?请给出步骤(15分)
相关推荐
- 2021年百度公司人工智能机器学习/数据挖掘工程师面试题 第1题: 简答题1. new 和 malloc 的区别。 2. hash冲突是指什么?怎么解决?给两种方法,写出过程和优缺点。 3. 命中的概率是 0.25,若要至少命中一次的概率不小于 0.75,则至少需要几次?第2题: 算法设计题1. 用C/C++写一个归并排序。 数据结构为struct Node…
- 百度 2021 硬件开发面试题 第1题: 阻塞与非阻塞区别第2题: 画出D触发器结构,解释建立时间和保持时间第3题: 名词解释:SIMD、VLIM第4题: CPU的5级流水是什么?流水线优缺点?第5题: 1——16循环计数器,用Verilog或VHDL第6题: SRAM设计FIFO,不要求程序,给出结构图及设计思路第7题…
- 经典笔试题-JDBC及Hibernate篇 五、JDBC 及Hibernate:(共12 题:基础10 道,中等难度2 道)110、数据库,比如100 用户同时来访,要采取什么技术解决?【基础】 答:可采用连接池。111、什么是ORM?【基础】 答:对象关系映射(Object—Relational Mapping,简称ORM)是一种为了解决面向对象…