零:Python安装:
从https://www.anaconda.com/download/下载Anaconda并安装,可以参考
https://zhuanlan.zhihu.com/p/61639212
Python快速上手,可以做一下基础练习:https://github.com/darkprinx/break-the-ice-with-python
一、 Numpy基础练习:
参考以下网址:
https://github.com/rougier/numpy-100,学习100道练习带你玩转Numpy,完成以下练习并提交相应代码。
1、创建从1到10的一维数组
import numpy as np
a = np.arange(1, 11)
print(a)
2、给定a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]),从数组中提取所有的奇数
import numpy as np
a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
even_numbers = a[a % 2 != 0]
print(even_numbers)
3、将a中的所有奇数替换为-1。
import numpy as np
a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
a[a % 2 != 0] = -1
print(a)
4、将一维数组a转换为2行的2维数组
import numpy as np
a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
a_reshaped = a.reshape(2, 5)
print(a_reshaped)
5、垂直堆叠数组a和数组b
import numpy as np
a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
b = np.array([11, 12, 13, 14, 15, 16, 17, 18, 19, 20])
c = np.vstack((a, b))
print(c)
6、水平堆叠数组a和数组b
import numpy as np
a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
b = np.array([11, 12, 13, 14, 15, 16, 17, 18, 19, 20])
c = np.hstack((a, b))
print(c)
7、获取数组a中值在5到8之间的所有项
import numpy as np
a = np.array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
selected_elements = a[(a >= 5) & (a <= 8)]
print(selected_elements)
8、交换数组a中的第1列和第2列
import numpy as np
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
交换数组第一列和第二列
a[[0, 1]] = a[[1, 0]]
print(a)
二、Pandas基础练习
参考以下网址:
https://www.heywhale.com/mw/project/5ddc974ef41512002cec1dca,学习50道练习带你玩转Pandas,完成以下练习并提交相应代码。
9、从数组a创建一个Series
10、从数组a创建 DataFrame df
11、显示df的基础信息,包括行的数量;列名;每一列值的数量、类型
12、显示df的前3列
13、将df的第1列从小到大排序
14、在df中插入一列,然后再删除这一列
15、将df中按第二列升序排列
import pandas as pd
# 创建一个数组a
a = [1, 2, 3, 4, 5]
# 从数组a创建一个Series
s = pd.Series(a)
print("从数组a创建一个Series:")
print(s)
# 从数组a创建 DataFrame df
df = pd.DataFrame({'A': a})
print("\n从数组a创建 DataFrame df:")
print(df)
# 显示df的基础信息
print("\n显示df的基础信息:")
print("行数量:", len(df))
print("列名:", df.columns)
print("列名数量:", len(df.columns))
print("每一列值的数量:", df.count())
print("每一列类型:", df.dtypes)
# 显示df的前3列
print("\n显示df的前3列:")
print(df.head(3))
# 将df的第1列从小到大排序
df['A'] = df['A'].sort_values()
print("\n将df的第1列从小到大排序:")
print(df)
# 在df中插入一列,然后再删除这一列
df['B'] = 10
print("\n在df中插入一列,然后再删除这一列:")
print(df)
df = df.drop('B', axis=1)
print(df)
# 将df中按第二列升序排列
df = df.sort_values(by='A', ascending=True)
print("\n将df中按第二列升序排列:")
print(df)