HZCU数据挖掘技术实验1 Python基础练习
HZCU数据挖掘技术实验1 Python基础练习

HZCU数据挖掘技术实验1 Python基础练习

零:Python安装:
从https://www.anaconda.com/download/下载Anaconda并安装,可以参考
https://zhuanlan.zhihu.com/p/61639212

Python快速上手,可以做一下基础练习:https://github.com/darkprinx/break-the-ice-with-python

一、 Numpy基础练习:
参考以下网址:
https://github.com/rougier/numpy-100,学习100道练习带你玩转Numpy,完成以下练习并提交相应代码

1、创建从1到10的一维数组

import numpy as np

a = np.arange(1, 11)
print(a)

2、给定a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]),从数组中提取所有的奇数

import numpy as np

a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
even_numbers = a[a % 2 != 0]
print(even_numbers)

3、将a中的所有奇数替换为-1。

import numpy as np

a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
a[a % 2 != 0] = -1
print(a)

4、将一维数组a转换为2行的2维数组

import numpy as np

a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
a_reshaped = a.reshape(2, 5)
print(a_reshaped)

5、垂直堆叠数组a和数组b

import numpy as np

a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
b = np.array([11, 12, 13, 14, 15, 16, 17, 18, 19, 20])
c = np.vstack((a, b))
print(c)

6、水平堆叠数组a和数组b

import numpy as np

a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
b = np.array([11, 12, 13, 14, 15, 16, 17, 18, 19, 20])
c = np.hstack((a, b))
print(c)

7、获取数组a中值在5到8之间的所有项

import numpy as np

a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
selected_elements = a[(a >= 5) & (a <= 8)]
print(selected_elements)

8、交换数组a中的第1列和第2列

import numpy as np

a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

交换数组第一列和第二列

a[[0, 1]] = a[[1, 0]]
print(a)

二、Pandas基础练习
参考以下网址:
https://www.heywhale.com/mw/project/5ddc974ef41512002cec1dca,学习50道练习带你玩转Pandas,完成以下练习并提交相应代码

9、从数组a创建一个Series

10、从数组a创建 DataFrame df

11、显示df的基础信息,包括行的数量;列名;每一列值的数量、类型

12、显示df的前3列

13、将df的第1列从小到大排序

14、在df中插入一列,然后再删除这一列

15、将df中按第二列升序排列

import pandas as pd

# 创建一个数组a
a = [1, 2, 3, 4, 5]

# 从数组a创建一个Series
s = pd.Series(a)
print("从数组a创建一个Series:")
print(s)

# 从数组a创建 DataFrame df
df = pd.DataFrame({'A': a})
print("\n从数组a创建 DataFrame df:")
print(df)

# 显示df的基础信息
print("\n显示df的基础信息:")
print("行数量:", len(df))
print("列名:", df.columns)
print("列名数量:", len(df.columns))
print("每一列值的数量:", df.count())
print("每一列类型:", df.dtypes)

# 显示df的前3列
print("\n显示df的前3列:")
print(df.head(3))

# 将df的第1列从小到大排序
df['A'] = df['A'].sort_values()
print("\n将df的第1列从小到大排序:")
print(df)

# 在df中插入一列,然后再删除这一列
df['B'] = 10
print("\n在df中插入一列,然后再删除这一列:")
print(df)
df = df.drop('B', axis=1)
print(df)

# 将df中按第二列升序排列
df = df.sort_values(by='A', ascending=True)
print("\n将df中按第二列升序排列:")
print(df)

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注