#学习笔记#
Git-hub链接
目录
1.题目列表
2.题解
1.题目列表
51. 创建一个表示位置(x,y)和颜色(r,g,b)的结构化数组(★★☆)
52. 考虑一个形状为(100,2)的随机向量,代表坐标,找出点对点的距离(★★☆)
53. 如何将一个浮点(32位)数组就地转换为整数(32位)数组?
54. 如何读取以下文件?(★★☆)
1, 2, 3,4, 5 6,, , 7,
8 , ,
9,10,11
55. 对于numpy数组,有什么等同于enumerate的函数?(★★☆)
56. 生成一个通用的2D高斯样数组(★★☆)
57. 如何在一个2D数组中随机放置p个元素?(★★☆)
58. 减去矩阵每行的平均值(★★☆)
59. 如何按照第n列排序一个数组?(★★☆)
60. 如何判断一个给定的2D数组是否有空列?(★★☆)
61. 在一个数组中找到最接近给定值的数(★★☆)
62. 考虑两个形状分别为(1,3)和(3,1)的数组,如何使用迭代器计算它们的和?(★★☆)
63. 创建一个具有name属性的数组类(★★☆)
64. 考虑一个给定的向量,如何给由第二个向量索引的每个元素加1(注意重复索引)?(★★★)
65. 如何根据索引列表(I)将向量(X)的元素累加到一个数组(F)中?(★★★)
66. 考虑一个(w,h,3)形状的图像(dtype=ubyte),计算唯一颜色的数量(★★☆)
67. 考虑一个四维数组,如何一次性获得最后两轴的和?(★★★)
68. 考虑一维向量D,如何使用描述子集索引的同大小向量S来计算D的子集均值?(★★★)
69. 如何获得点积的对角线?(★★★)
70. 考虑向量[1, 2, 3, 4, 5],如何构建一个新向量,在每个值之间插入3个连续的零?(★★★)
71. 考虑一个维度为(5,5,3)的数组,如何将其乘以一个维度为(5,5)的数组?(★★★)
72. 如何交换数组的两行?(★★★)
73. 考虑一组描述10个三角形(具有共享顶点)的10个三元组,找到组成所有三角形的唯一线段集(★★★)
74. 给定一个对应于bincount的排序数组C,如何产生一个数组A使得np.bincount(A) == C?(★★★)
75. 如何使用数组上的滑动窗口计算平均值?(★★★)
2.题解
51. 创建一个表示位置(x,y)和颜色(r,g,b)的结构化数组(★★☆)
dtype = [('position',[('x',float),('y',float)]),('color',[('r',int),('g',int),('b',int)])]position_and_color = np.zeros(10,dtype=dtype)
position_and_color['position']['x'] = np.random.uniform(0,100,10)
position_and_color['position']['y'] = np.random.uniform(0,100,10)
position_and_color['color']['r'] = np.random.randint(0,256,10)
position_and_color['color']['g'] = np.random.randint(0,256,10)
position_and_color['color']['b'] = np.random.randint(0,256,10)
52. 考虑一个形状为(100,2)的随机向量,代表坐标,找出点对点的距离(★★☆)
points = np.random.rand(100,2) # 表示100个点的坐标
diff = points[:,np.newaxis,:] - points[np.newaxis,:,:] # 计算点与点之间的距离,这里我们扩展了维度使得每一个点都和原来的点有比较
distance = np.linalg.norm(diff,axis=-1) # 计算每一对点之间的距离,linalg就是计算的范数,计算的是一个向量所有元素的平方,和,然后开根
distance # 100个点会产生10000个距离
53. 如何将一个浮点(32位)数组就地转换为整数(32位)数组?
float_array = np.array([1.2,1.3,2.3,2.4,2.4],dtype=np.float32)
int_array = float_array.astype(np.int32)
54. 如何读取以下文件?(★★☆)
1, 2, 3,4, 5 6,, , 7,
8 , ,
9,10,11
# 读取文件
# 'data.csv' 是文件路径,dtype = float 指定数组的数据类型,delimiter = ',' 指定分隔符
# missing_value = ' ' 指定缺失值,如果文件中缺失值用空格表示,那么这里可以指定为空格
data = np.genfromtxt('data.csv',dtype=float,delimiter=',',missing_value=' ',filling_values=np.nan)
# filling_values 指定缺失值被替换的值,这里我们用NaN表示
55. 对于numpy数组,有什么等同于enumerate的函数?(★★☆)
arr = np.array([[1,2],[3,4]])for index,value in np.ndenumerate(arr):print(index,value)
# 输出结果:
# (0, 0) 1
# (0, 1) 2
# (1, 0) 3
# (1, 1) 4
56. 生成一个通用的2D高斯样数组(★★☆)
def generate_2d_gaussian(size, sigma):"""生成一个给定大小和标准差的 2D 高斯核,包含归一化常数。"""# 生成 x 和 y 的坐标x, y = np.meshgrid(np.linspace(-size // 2, size // 2, size), np.linspace(-size // 2, size // 2, size))# 计算高斯函数,包含归一化常数g = (1 / (2 * np.pi * sigma**2)) * np.exp(-(x**2 + y**2) / (2 * sigma**2))# 归一化,使所有值的和为 1g /= g.sum()return g# 示例:生成一个 5x5 大小,标准差为 1 的高斯核
gaussian_kernel = generate_2d_gaussian(5, 1)
57. 如何在一个2D数组中随机放置p个元素?(★★☆)
def place_elements_randomly(shape,p,value=1):'''在给定形状的2D数组中随机放置p个元素,默认为1:param shape:一个元组,制定了2D数组的形状:param p:整数,指定要放置的元素个数:param value:要放置的元素的值,默认为1:return:修改后的2D数组'''# 创建初始数组arr = np.zeros(shape,dtype=int)# 计算所有可能可能的位置all_positions = np.arange(arr.size)# 随机选择p个不重复的位置chosen_positions = np.random.choice(all_positions,p,replace=False)# 在选定的位置放置元素np.put(arr,chosen_positions,value)return arr
58. 减去矩阵每行的平均值(★★☆)
arr = np.array([[0,1,2],[1,1,1],[2,2,2]])
arr.mean(axis=1)
arr_mean = arr - arr.mean(axis=1,keepdims=True)
59. 如何按照第n列排序一个数组?(★★☆)
arr = np.array([[0,1,2],[1,1,1],[2,2,2]])
arr[arr[:,2].argsort()]
# argsort()返回的是数组中元素的索引,argsort()默认是升序排序
60. 如何判断一个给定的2D数组是否有空列?(★★☆)
arr = np.array([[1,2,3],[4,5,6],[7,8,np.nan]])
np.isnan(arr).any(axis=0)
# .any()相当于or的操作,加上axis=0,表示判断每一列
61. 在一个数组中找到最接近给定值的数(★★☆)
arr = np.array([4, 2, 9, 6, 10, 1])
target = 8
arr[(np.abs(arr-target)).argmin()]
# .argming()返回的是数组中最小元素的索引
62. 考虑两个形状分别为(1,3)和(3,1)的数组,如何使用迭代器计算它们的和?(★★☆)
# 定义两个数组
a = np.array([[1, 2, 3]])
b = np.array([[1], [2], [3]])# 手动广播到共同形状
a_broadcasted, b_broadcasted = np.broadcast_arrays(a, b)
# np.broadcast_arrays()会返回输入数组的广播版本列表,这些返回的数组试图表面看似具有相同的形状# 创建一个空数组用于存放结果,形状与广播后的数组相同
result = np.empty(a_broadcasted.shape, dtype=a_broadcasted.dtype)# 使用迭代器逐元素计算和
it = np.nditer([a_broadcasted, b_broadcasted, result], [], [['readonly'], ['readonly'], ['writeonly', 'allocate']])
for x, y, z in it:z[...] = x + yresult
63. 创建一个具有name属性的数组类(★★☆)
class NamedArray(np.ndarray):def __new__(cls,input_array,name=''):# 使用__new__方法创建对象.因为np.darry是不可变的# 我们需要在对象被创建时设置obj = np.asarray(input_array).view(cls)obj.name = namereturn objdef __array_finalize__(self,obj):# __array_finalize__方法在对象被创建时被调用# 用来设置属性,这里确保name属性也会被复制if obj is None:returnself.info = getattr(obj,'name', '')
64. 考虑一个给定的向量,如何给由第二个向量索引的每个元素加1(注意重复索引)?(★★★)
# 可以使用Numpy的'np.add.at'方法,这个方法允许对数组的特定索引执行就地操作,或直接修改原数组
# 当遇到重复索引时,会对每个重复的索引都进行操作# 定义原始向量
v = np.array([1, 2, 3, 4, 5])# 定义索引向量,可能包含重复的索引
i = np.array([0, 1, 2, 1, 3, 3, 4])# 使用 np.add.at 对 v 的指定索引进行加 1 操作
np.add.at(v, i, 1)print(v)
65. 如何根据索引列表(I)将向量(X)的元素累加到一个数组(F)中?(★★★)
# 同样使用np.add.at方法,这个方法允许对数组的特定索引执行就地操作,或直接修改原数组# 定义向量 X
X = np.array([1.1, 2.2, 3.3, 4.4, 5.5])# 定义索引列表 I
I = np.array([0, 1, 2, 1, 3])# 定义目标数组 F,假设我们想要累加到的数组有 5 个元素,初始化为 0
F = np.zeros(5)# 使用 np.add.at 根据索引 I 将 X 的元素累加到 F 中
np.add.at(F, I, X)print(F)
66. 考虑一个(w,h,3)形状的图像(dtype=ubyte),计算唯一颜色的数量(★★☆)
# 假设 img 是一个 (w,h,3) 形状的图像数组,这里使用随机数据来模拟一个图像
w, h = 100, 100 # 图像的宽度和高度
img = np.random.randint(0, 256, size=(w, h, 3), dtype=np.ubyte) # 生成一个模拟图像# 将图像数组重塑为 (w*h, 3)
reshaped_img = img.reshape((-1, 3))# 将重塑后的数组视为含有多个字段的结构化数组,使 np.unique 能按三元组处理
unique_colors = np.unique(reshaped_img.view([('', reshaped_img.dtype)]*3), axis=0)# 计算唯一颜色的数量
num_unique_colors = unique_colors.shape[0]print("Number of unique colors:", num_unique_colors)
67. 考虑一个四维数组,如何一次性获得最后两轴的和?(★★★)
# 创建一个四维数组
arr = np.arange(48).reshape((2, 3, 4, 2))# 计算最后两个轴的和
sum_last_two_axes = np.sum(arr, axis=(-2, -1))print(sum_last_two_axes)
68. 考虑一维向量D,如何使用描述子集索引的同大小向量S来计算D的子集均值?(★★★)
# 使用布尔索引 D[S] 来选择向量 D 中与 S 中对应为 True 的元素。然后,我们使用 np.mean 函数计算所选子集的平均值。
D = np.array([1, 2, 3, 4, 5])
S = np.array([True, False, True, False, True])subset_mean = np.mean(D[S])print(subset_mean)
69. 如何获得点积的对角线?(★★★)
# 可以使用 NumPy 的 np.einsum 函数来计算两个数组的点积,并同时获取点积结果的对角线。
# 创建两个数组
a = np.array([[1, 2, 3],[4, 5, 6]])b = np.array([[7, 8],[9, 10],[11, 12]])# 计算点积并获取对角线
dot_product_diagonal = np.einsum('ij,ji->i', a, b)print(dot_product_diagonal)
70. 考虑向量[1, 2, 3, 4, 5],如何构建一个新向量,在每个值之间插入3个连续的零?(★★★)
# 使用 np.insert 函数将 zero_vector 插入到原始向量的特定位置。我们使用 np.arange(1, len(original_vector) + 1) * 4 - 1 来生成要插入的位置索引,这样就能在每个原始值之后插入 3 个连续的零。
# 原始向量
original_vector = np.array([1, 2, 3, 4, 5])# 零向量
zero_vector = np.zeros(3 * len(original_vector))# 构建新向量
new_vector = np.insert(original_vector, np.arange(1, len(original_vector) + 1) * 4 - 1, zero_vector)print(new_vector)
71. 考虑一个维度为(5,5,3)的数组,如何将其乘以一个维度为(5,5)的数组?(★★★)
# 使用广播功能,将维度为 (5,5) 的数组 arr_2d 扩展为维度为 (5,5,1) 的数组,以便与维度为 (5,5,3) 的数组 arr_3d 进行逐元素乘法。这是通过 arr_2d[:, :, np.newaxis] 实现的。
# 创建一个维度为 (5,5,3) 的数组
arr_3d = np.random.randint(1, 10, size=(5, 5, 3))# 创建一个维度为 (5,5) 的数组
arr_2d = np.random.randint(1, 5, size=(5, 5))# 对数组进行乘法运算
result = arr_3d * arr_2d[:, :, np.newaxis]print(result)
72. 如何交换数组的两行?(★★★)
# 可以通过直接交换行的索引来实现
# 创建一个数组
arr = np.arange(25).reshape((5, 5))# 交换第一行和第三行
arr[[0, 2]] = arr[[2, 0]]print(arr)
73. 考虑一组描述10个三角形(具有共享顶点)的10个三元组,找到组成所有三角形的唯一线段集(★★★)
# 假设 triangles 是一个包含 10 个三元组的数组,每个三元组代表一个三角形的三个顶点
# 这里用随机数据生成一个示例
np.random.seed(0) # 保证可重复性
triangles = np.random.randint(1, 100, (10, 3))# 生成线段
# 每个三角形由三个顶点组成,因此有三个线段:(v1, v2), (v2, v3), (v1, v3)
segments = np.vstack([triangles[:, [0, 1]], triangles[:, [1, 2]], triangles[:, [0, 2]]])# 标准化线段,确保每个线段的起点小于终点
segments = np.sort(segments, axis=1)# 去除重复的线段
unique_segments = np.unique(segments, axis=0)print("Unique segments:")
print(unique_segments)
74. 给定一个对应于bincount的排序数组C,如何产生一个数组A使得np.bincount(A) == C?(★★★)
# bincount用来计算整数数组中各个元素的频率
# 给定的排序数组 C,表示 np.bincount 的结果
C = np.array([0, 2, 1, 0, 4])# 产生数组 A
A = np.repeat(np.arange(len(C)), C)print("Generated Array A:", A)
75. 如何使用数组上的滑动窗口计算平均值?(★★★)
#首先定义了一个简单的数组 a 和一个窗口大小 N。然后,我们创建了一个均匀的权重数组 window,其所有元素之和为 1。最后,我们通过 np.convolve 函数与这个窗口进行卷积,计算滑动平均值。
# 示例数组
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])# 窗口大小
N = 3# 创建一个等于滑动窗口大小的均匀权重数组
window = np.ones(N) / N# 计算滑动平均值
# mode='valid' 意味着只计算完全覆盖数组的窗口位置
# 这会导致输出数组的大小比输入数组小
moving_average = np.convolve(a, window, mode='valid')print(moving_average)
后续会更行全部100题
以上
学习在于行动,总结和坚持,共勉