形成性考核一_形考任务一:客观题
试卷总分:100 得分:100
咨询答案:ffffd79
咨询答案:ffffd79
咨询答案:ffffd79
1.下列哪个选项不属于大数据的特点?( )
A.海量化的数据
B.大数据都是有价值的数据
C.数据类型的多样化
D.大数据的价值密度相对较低
2.下列哪个选项不属于大数据处理的环节?( )
A.数据模型
B.数据预处理
C.数据分析
D.数据可视化
3.下列不属于大数据思维的是( )。
A.全样思维
B.容错思维
C.抽样思维
D.相关思维
4.下列关于Jupyter Notebook,说法不正确的是( )
A.Jupyter Notebook是Anaconda集成环境中自带的代码编辑器
B.Jupyter Notebook是一个网页程序
C.Jupyter Notebook页面单元格中不仅可以输入代码还可以输入文字
D.Jupyter Notebook的Markdown单元中只能输入文字
5.下列print语句使用正确的是( )。
A.print(“你好,大数据”)
B.print(你好,大数据)
C.print([你好,大数据])
D.print'你好,大数据'
6.Jupyter Notebook中每个代码单元可书写( )行代码。
A.一至多
B.一
C.十
D.两
7.大数据产生的原因包括( )。
A.全球所有人都是信息的接收者和产生者
B.各类传感器24小时不停地产生数据
C.人类活动的进一步扩展使数据规模急剧膨胀
D.收集数据的技术手段越来越丰富
8.大数据的“4V”特点具体指()。
A.Volume
B.Variety
C.Velocity
D.Value
9.Value是指大数据的价值密度。与结构化数据相比,大数据的价值密度相对较高。
10.有多种方法可以启动Jupyter Notebook。
形成性考核二_形考任务二:客观题
试卷总分:100 得分:100
1.下面代码中x的值最终等于( )。
x=10
x=20
x=x+1
A.21
B.20
C.11
D.10
2.定义变量a=888,该变量值的类型是( )。
A.整型
B.浮点型
C.字符型
D.布尔型
3.下面代码中, print( )输出值的数量为( )。
str1 = 'Hello!'
str2 = 'World!'
print(str1, str2)
A.1个
B.2个
C.3个
D.4个
4.定义 cList2=[1,2,3,4],则cList2[0]的执行结果为( )。
A.0
B.1
C.2
D.3
5.下面代码中,首次进入for循环体的输出结果是( )。
for i in [0,1,2,3]:
print('i的值为{}'.format(i))
A.i=1
B.i=2
C.i=3
D.i=0
6.下列Python变量名书写符合命名规则的是( )。
A.11num
B.num11
C.print
D.Num11
7.在Python的双分支结构语法格式中,当if条件表达式为( )时,将执行if分支体中的语句。
A.真
B.假
C.True
D.False
8.程序的三种基本控制结构是( )。
A.逻辑结构
B.分支结构
C.循环结构
D.顺序结构
9.运行如下代码,输出结果是( )。
for i in range(3,6):
print('*')
A.输出三行,每行各一个*
B.输出一行,包括三个*
C.输出四行,每行各一个+*
D.输出一行,包括四个*
10.划线处的正确代码是( )。
if(————):
print("cROE小于roeAvg.")
A.cROE = = roeAvg
B.cROE < roeAvg
C.cROE > roeAvg
D.cROE >= roeAvg
形成性考核三_形考任务三:客观题
试卷总分:100 得分:100
1.下面不属于Series创建方法的是()。
A.通过一维数组创建序列
B.通过字典的方式创建序列
C.通过DataFrame中的某一行或某一列创建序列
D.通过二维数据创建
2.关于Pandas数据读写的说法中,下列描述错误的是()。
A.read_csv()能够读取所有文本数据
B.read_sql()可以读取数据库中的数据
C.to_csv()能够将结构化数据写入到csv文件中
D.to_excel()能够将结构化数据写入到excel文件中
3.下列代码正确的执行结果是( )。
s = pd.Series([1,2,4],index=['a','b','c'])
print(s)
A.a 1 b 2 c 4
B.a 1 c 2 b 3
C.a b c 1 2 4
D.a 1 b 3 c 2
4.下列函数中,不属于Pandas统计计算函数的是( )。
A.mean()
B.sum()
C.min()
D.print()
5.下列选项中,( )函数可以一次性输出多个统计指标。
A.describe()
B.mean()
C.input()
D.sum()
6.现有如下工资数据集,求最高工资,正确代码是( )。
data={'李伟':10000,'张妍':12000,'赵丽':13000,'杨朋':9000}
s = pd. Series(data)
print(s)
A.s.max()
B.s.max(axis=1)
C.s.min()
D.s.min(axis=1)
7.下列关于Pandas数据排序说法正确的是()。
A.sort_values()可以按值排序
B.sort_values()可以按索引排序
C.sort_index()可以按索引排序
D.sort_index()可以按值排序
8.下列选项中,关于groupby()的操作正确的是( )。
A.list(df.groupby('系部'))
B.df.groupby(by='系部')
C.df.groupby('系部',sort=True)
D.df.groupby( '系部','性别')
9.loc方法是基于索引的数据访问方法,iloc方法是基于位置索引的访问方法
10.groupby方法可以使用多个分组标签。
形成性考核四_形考任务四:客观题
试卷总分:100 得分:100
1.下列关于数据预处理的描述中,描述不正确的是( )。
A.数据清洗的目的是为了提高数据质量
B.空值一定要删除
C.数据预处理包括数据的清洗、合并、重塑与转换
D.在Pandas中,缺失值使用NaN表示
2.下面关于dropna()的axis参数描述中,说法正确的是( )。
A.默认axis=0,删除包含缺失值的列
B.默认axis=0,删除包含缺失值的行
C.默认axis=1,删除包含缺失值的列
D.默认axis=1,删除包含缺失值的行
3.下列关于Matplotlib库的描述中,说法不正确的是()。
A.Matplotlib是当前用于数据可视化的最流行的Python包之一
B.Matplotlib提供了绘制散点图、条形图、折线图、饼图、直方图的方法
C.可通过交互方式实现数据可视化
D.Matplotlib不能支持中文显示
4.plot(x,y)的命令含义是( )。
A.打印
B.输出
C.绘图
D.计算
5.想要在数据集df第1列前插入一列[88,90,69,65,89,82],列标签是“C语言”。下列代码正确的是( )。
A.df.insert(1,"C语言",[88,90,69,65,89,82])
B.df.insert(0,"C语言",[88,90,69,65,89,82])
C.df.add(1,"C语言",[88,90,69,65,89,82])
D.df.append(1,"C语言",[88,90,69,65,89,82])
6.Pandas提供了isnull()函数和notnull()函数来检测数据中是否存在缺失值。
7.在Pandas中可以实现数据合并的方法只有concat()。
8.数据转置是指对数据的行列进行互换,在这个过程中数据集的形状发生改变。
9.有如下数据集df,
{图}
要增加一列“总成绩”,实现如下图的效果:{图}
那么正确的代码是( )。
A.df['总成绩']=0
B.df[总成绩]=0
C.df['总成绩']=[0,0,0,0,0,0]
D.总成绩=0
10.从如下程序生成的数据集中只提取语文和数学这两列,下列选项中代码正确的是( )。
import pandas as pd
data = {'语文': [86,99, 68, 83, 79, 91],
'数学':[78,66,58,75,77, 59],
'英语': [68, 99, 68,83, 79, 91],
'地理': [88, 90, 78,63, 100, 71]}
df= pd.DataFrame(data,index=['李东','李力','王平','赵平','张也','马云',])
df
A.df['语文' , '数学']
B.df[ ['语文' , '数学'] ]
C.df[ { '语文' '数学' } ]
D.df.iloc[['语文','数学']]
试卷总分:100 得分:100
咨询答案:ffffd79
咨询答案:ffffd79
咨询答案:ffffd79
1.下列哪个选项不属于大数据的特点?( )
A.海量化的数据
B.大数据都是有价值的数据
C.数据类型的多样化
D.大数据的价值密度相对较低
2.下列哪个选项不属于大数据处理的环节?( )
A.数据模型
B.数据预处理
C.数据分析
D.数据可视化
3.下列不属于大数据思维的是( )。
A.全样思维
B.容错思维
C.抽样思维
D.相关思维
4.下列关于Jupyter Notebook,说法不正确的是( )
A.Jupyter Notebook是Anaconda集成环境中自带的代码编辑器
B.Jupyter Notebook是一个网页程序
C.Jupyter Notebook页面单元格中不仅可以输入代码还可以输入文字
D.Jupyter Notebook的Markdown单元中只能输入文字
5.下列print语句使用正确的是( )。
A.print(“你好,大数据”)
B.print(你好,大数据)
C.print([你好,大数据])
D.print'你好,大数据'
6.Jupyter Notebook中每个代码单元可书写( )行代码。
A.一至多
B.一
C.十
D.两
7.大数据产生的原因包括( )。
A.全球所有人都是信息的接收者和产生者
B.各类传感器24小时不停地产生数据
C.人类活动的进一步扩展使数据规模急剧膨胀
D.收集数据的技术手段越来越丰富
8.大数据的“4V”特点具体指()。
A.Volume
B.Variety
C.Velocity
D.Value
9.Value是指大数据的价值密度。与结构化数据相比,大数据的价值密度相对较高。
10.有多种方法可以启动Jupyter Notebook。
形成性考核二_形考任务二:客观题
试卷总分:100 得分:100
1.下面代码中x的值最终等于( )。
x=10
x=20
x=x+1
A.21
B.20
C.11
D.10
2.定义变量a=888,该变量值的类型是( )。
A.整型
B.浮点型
C.字符型
D.布尔型
3.下面代码中, print( )输出值的数量为( )。
str1 = 'Hello!'
str2 = 'World!'
print(str1, str2)
A.1个
B.2个
C.3个
D.4个
4.定义 cList2=[1,2,3,4],则cList2[0]的执行结果为( )。
A.0
B.1
C.2
D.3
5.下面代码中,首次进入for循环体的输出结果是( )。
for i in [0,1,2,3]:
print('i的值为{}'.format(i))
A.i=1
B.i=2
C.i=3
D.i=0
6.下列Python变量名书写符合命名规则的是( )。
A.11num
B.num11
C.print
D.Num11
7.在Python的双分支结构语法格式中,当if条件表达式为( )时,将执行if分支体中的语句。
A.真
B.假
C.True
D.False
8.程序的三种基本控制结构是( )。
A.逻辑结构
B.分支结构
C.循环结构
D.顺序结构
9.运行如下代码,输出结果是( )。
for i in range(3,6):
print('*')
A.输出三行,每行各一个*
B.输出一行,包括三个*
C.输出四行,每行各一个+*
D.输出一行,包括四个*
10.划线处的正确代码是( )。
if(————):
print("cROE小于roeAvg.")
A.cROE = = roeAvg
B.cROE < roeAvg
C.cROE > roeAvg
D.cROE >= roeAvg
形成性考核三_形考任务三:客观题
试卷总分:100 得分:100
1.下面不属于Series创建方法的是()。
A.通过一维数组创建序列
B.通过字典的方式创建序列
C.通过DataFrame中的某一行或某一列创建序列
D.通过二维数据创建
2.关于Pandas数据读写的说法中,下列描述错误的是()。
A.read_csv()能够读取所有文本数据
B.read_sql()可以读取数据库中的数据
C.to_csv()能够将结构化数据写入到csv文件中
D.to_excel()能够将结构化数据写入到excel文件中
3.下列代码正确的执行结果是( )。
s = pd.Series([1,2,4],index=['a','b','c'])
print(s)
A.a 1 b 2 c 4
B.a 1 c 2 b 3
C.a b c 1 2 4
D.a 1 b 3 c 2
4.下列函数中,不属于Pandas统计计算函数的是( )。
A.mean()
B.sum()
C.min()
D.print()
5.下列选项中,( )函数可以一次性输出多个统计指标。
A.describe()
B.mean()
C.input()
D.sum()
6.现有如下工资数据集,求最高工资,正确代码是( )。
data={'李伟':10000,'张妍':12000,'赵丽':13000,'杨朋':9000}
s = pd. Series(data)
print(s)
A.s.max()
B.s.max(axis=1)
C.s.min()
D.s.min(axis=1)
7.下列关于Pandas数据排序说法正确的是()。
A.sort_values()可以按值排序
B.sort_values()可以按索引排序
C.sort_index()可以按索引排序
D.sort_index()可以按值排序
8.下列选项中,关于groupby()的操作正确的是( )。
A.list(df.groupby('系部'))
B.df.groupby(by='系部')
C.df.groupby('系部',sort=True)
D.df.groupby( '系部','性别')
9.loc方法是基于索引的数据访问方法,iloc方法是基于位置索引的访问方法
10.groupby方法可以使用多个分组标签。
形成性考核四_形考任务四:客观题
试卷总分:100 得分:100
1.下列关于数据预处理的描述中,描述不正确的是( )。
A.数据清洗的目的是为了提高数据质量
B.空值一定要删除
C.数据预处理包括数据的清洗、合并、重塑与转换
D.在Pandas中,缺失值使用NaN表示
2.下面关于dropna()的axis参数描述中,说法正确的是( )。
A.默认axis=0,删除包含缺失值的列
B.默认axis=0,删除包含缺失值的行
C.默认axis=1,删除包含缺失值的列
D.默认axis=1,删除包含缺失值的行
3.下列关于Matplotlib库的描述中,说法不正确的是()。
A.Matplotlib是当前用于数据可视化的最流行的Python包之一
B.Matplotlib提供了绘制散点图、条形图、折线图、饼图、直方图的方法
C.可通过交互方式实现数据可视化
D.Matplotlib不能支持中文显示
4.plot(x,y)的命令含义是( )。
A.打印
B.输出
C.绘图
D.计算
5.想要在数据集df第1列前插入一列[88,90,69,65,89,82],列标签是“C语言”。下列代码正确的是( )。
A.df.insert(1,"C语言",[88,90,69,65,89,82])
B.df.insert(0,"C语言",[88,90,69,65,89,82])
C.df.add(1,"C语言",[88,90,69,65,89,82])
D.df.append(1,"C语言",[88,90,69,65,89,82])
6.Pandas提供了isnull()函数和notnull()函数来检测数据中是否存在缺失值。
7.在Pandas中可以实现数据合并的方法只有concat()。
8.数据转置是指对数据的行列进行互换,在这个过程中数据集的形状发生改变。
9.有如下数据集df,
{图}
要增加一列“总成绩”,实现如下图的效果:{图}
那么正确的代码是( )。
A.df['总成绩']=0
B.df[总成绩]=0
C.df['总成绩']=[0,0,0,0,0,0]
D.总成绩=0
10.从如下程序生成的数据集中只提取语文和数学这两列,下列选项中代码正确的是( )。
import pandas as pd
data = {'语文': [86,99, 68, 83, 79, 91],
'数学':[78,66,58,75,77, 59],
'英语': [68, 99, 68,83, 79, 91],
'地理': [88, 90, 78,63, 100, 71]}
df= pd.DataFrame(data,index=['李东','李力','王平','赵平','张也','马云',])
df
A.df['语文' , '数学']
B.df[ ['语文' , '数学'] ]
C.df[ { '语文' '数学' } ]
D.df.iloc[['语文','数学']]