欢迎来到编程资源网!

Python面试

当前位置:主页 > 面试宝典 > Python面试 >

python数据分析师面试题选

时间:2019-03-16|栏目:Python面试|点击:

1. 如何利用SciKit包训练一个简单的线性回归模型
利用linear_model.LinearRegression()函数 

# Create linear regression object
regr = linear_model.LinearRegression()
# Train the model using the training sets
regr.fit(data_X_train, data_y_train)

2. 例举几个常用的python分析数据包及其作用
数据处理和分析:NumPy, SciPy, Pandas
机器学习:SciKit
可视化: Matplotlib, Seaborn

3. 如何利用Numpy对数列的前n项进行排序
使用argsort()函数:x[x [: n-1].argsort ()]

4. 如何检验一个数据集或者时间序列是随机分布的
画lag plot(Correlogram:相关图),如果图上的点呈散乱分布,则为随机

5. 在python中如何创建包含不同类型数据的dataframe
利用pandas包的DataFrame函数的serias创建列然后用dtype定义类型:
df = pd.DataFrame({'x': pd.Series(['1.0', '2.0', '3.0'], dtype=float), 'y': pd.Series(['1', '2', '3'], dtype=int)})

6. Pandas中使用的标准数据缺失标志是什么
NaN

7. 描述numpy array比python list的优势

a. numpy array比python list更紧凑,存储数据占的空间小,读写速度快。(这是由于python list储存的是指向对象(至少需要16个字节)的指针(至少4个字节);而array中储存的是单一变量(比如单精度浮点数为4个字节,双精度为8)) 

b. array可以直接使用vector和matrix类型的处理函数,非常方便。

8. 如何检验numpy的array为空
使用size函数, 比如

a = np.array([])
print a.size # 0

**9. 如何检验pandas dataframe为空?
使用empty函数

程序员资源社区

公众号回复:面试,领取Python,Java面试题和简历

上一篇:2017 Python最新面试题及答案16道题

栏    目:Python面试

下一篇:数据分析面试题

本文标题:python数据分析师面试题选

本文地址:http://www.python66.cn/mianshi/python/397.html

您可能感兴趣的文章

广告投放 | 文章投稿 | 版权申明

重要申明:本站所有的文章、图片、软件等仅用作学习交流

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:476430956 | 邮箱:476430956@qq.com

Copyright © 2019-2029 编程教程网 版权所有 Power by DeDe58