202109180934 - python环境问题-编程知识

202109180934 - python环境问题

news/2025/3/20 19:23:33/文章来源:https://www.cnblogs.com/route/p/18783788

1. os.environ

executors数量增加后，出现以下问题：

TaskSetManager: Lost task 10.3 in stage 1.0 (TID 21) on executor OCDC-ARM-DN-160: org.apache.spark.SparkException (
Error from python worker:./python36/mlpy_env/bin/python: ./python36/mlpy_env/bin/python: 无法执行二进制文件python是在x86上编译打包的，要运行在arm机器上会报错。
需要交叉编译。交叉编译交叉编译可以理解为，在当前编译平台下，编译出来的程序能运行在体系结构不同的另一种目标平台上，但是编译平台本身却不能运行该程序：
比如，我们在 x86 平台上，编写程序并编译成能运行在 ARM 平台的程序，编译得到的程序在 x86 平台上是不能运行的，必须放到 ARM 平台上才能运行。
---
原文链接：https://blog.csdn.net/pengfei240/article/details/52912833

目前的环境是：
x86_64机器上只有python基础环境，arm机器上有需要的所有环境
根据机器的架构来判断，选择hdfs上指定的python库或直接使用本地环境

对提交的python代码进行了拆分，
由一个py文件拆成两个，
main文件用于创建sparkcontext，在executors中执行操作
mean_shift文件封装了聚类算法相关的操作，在这个文件中import相关库。在import之前做条件判断

1. 判断cpu架构
  现在先获取arm架构的机器的arch输出是什么？其实是platform.machine()的输出

设置环境变量，仅仅是设置某个值为指定字符串。
不奏效arch=platform.machine()
arch=str(arch).lower()
arm="ar"
if len(arm and arch) == 2:os.environ['PYSPARK_PYTHON'] = '/usr/bin/python'
else:os.environ['PYSPARK_PYTHON'] = './python36/mlpy_env/bin/python'

os.environ有四个执行位置

flowchart TB client env --> main.py import --> main.py func() --> my.py import --> my.py func()

client env
客户端环境
main.py
driver程序中的代码在客户端本地执行

  # -*- coding:utf-8 -*-
import os
from pyspark import SparkContext
import platform
from ms import add_arch, run# 客户端执行
#psenv=os.environ.get('PYSPARK_PYTHON', 'no python 1')
#env=os.environ.get('PYTHON_HOME', 'no python 2')
#print("psenv = " +psenv)
#print("env = " + env)
# os.environ['PYSPARK_PYTHON'] = './python36/mlpy_env/bin/python'
os.environ['PYSPARK_PYTHON'] = '/usr/bin/python'

2. sys.path

python中import某个A模块时，首先会从python的内置模块中查找是否含义该模块的定义若未查询到会从sys.path对应的模块路径查询是否含有对应模块的定义，如果搜索完成依然没有对应A模块时则抛出import的异常

python sys.path添加包路径

>>> import sys
>>> print(sys.path)>>> sys.path += ['path1', 'path2']
>>> print(sys.path)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/902158.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

202109060657 - hadoop架构和读写流程

1. 整体架构 hdfs架构zkmonode高可用。HA的工作原理？是否需要每个datanode监听zk？namenodeNameNode(nn):Hdfs集群的管理者，Master 管理Hdfs的名称空间（NameSpace）维护副本策略记录文件块（Block）的映射信息负责处理客户端读写请求datanodeDataNode:NameNode下达命令，…

1.程序功能描述基于风险的完整性和检查建模(Risk-Based Integrity and Inspection Modeling ,RBIIM)MATLAB仿真，对比prior density，posterior perfect inspection，posterior imp inpection，cummulative posterior imperfect inspection四个指标。 2.测试软件版本以及…

202108151156 - kafka消费积压案例

0. 背景上游厂家生产信令数据，我方消费kafka数据，过滤后插入HBase。上游生产的信令数据分了4个主题，每个主题有若干分区，这4个主题的数据消费后都插入同一张HBase表。问题：kafka消息积压达到百亿。以下以topic1为例，有6个分区。 1. 查看消费滞后情况 kafka-consumer-…

mysql 多表怎么连接的

前言简单描述一下多表怎么连接的。正文首先，我们得抛开我们一些自以为是的想法。我想过这个问题，就是为什么我们背乘法口诀的时候，我们总是背： 22 = 4， 99=81 这样背下去，似乎这是口诀。然而这是缓存，不是计算，既然不是计算那么就不是逻辑学。我们理所当然的想9*9…

202108120808 - 类加载器及双亲委派机制

Bootstrap ClassLoader 这是加载器中的大 Boss，任何类的加载行为，都要经它过问。它的作用是加载核心类库，也就是 rt.jar、resources.jar、charsets.jar 等。当然这些 jar 包的路径是可以指定的，-Xbootclasspath 参数可以完成指定操作。这个加载器是 C++ 编写的，随着 JVM …

keil仿真时导出数据操作

keil仿真时导出数据操作 save D:\savedata.txt 0x20001013,0x20001035

spring-boot-starter-validation

官方提供的注解 spring-boot-starter-validation 是 Spring Boot 提供的一个 starter，是一个用于验证 Java Bean 的标准，它提供了一套注解和相应的运行时 API 来定义和执行校验规则。具体来说，当你在项目中引入 spring-boot-starter-validation 后，你可以使用一系列预定义…

省选算法复习

省选算法复习 1. 线段树优化建图当我们需要向区间内所有点连边或者从区间中所有点连到某个点的时候，便可以使用线段树来优化，如果需要从区间每一个点连到另一个区间每一个点的话，加一个虚点就好了。这不是一个很困难的技巧，关键在于要建模。 P5471 [NOI2019] 弹跳 - 洛谷…

fastadmin订单父子表管理端

fastadmin后台父子表使用方法发布于 2021-01-22 12:48:10fastadmin后台的所有表格都是支持父子表配置的，只需要简单修改一下对应的JS即可，下面直接进入主题。示例是我的全国省市行政区划表，是从国家统计局网站采集下来的，共五级行政数据，非常适合用来做父子表，按照级别一…

Rudolf and k Bridges

Rudolf and k Bridges 题目大致题意上图为俯视图有一个\(nXm\)的网格，下标从\(1-n\) 以及从 \(1-m\)，\((i, j)\) 的值就是这个这垂直一格水的深度现在要安装支架，有几个信息：\((i, 1)\) 和 \((i, m)\) 处必须要安装相邻支架的距离不能超过 \(d\), 相邻距离为 \(abs(j - …

背离Divergence Trading ，贪小便宜

趋势交易（trend trading）和背离交易（divergence trading），代表了两种不同的交易策略。做背离交易相当于赌市场短期失效，承认你比市场聪明，虽然能赚小钱，但往往是亏大钱的根源。贪小便宜爱背离，贪小便宜(gain small advantages)不爱止损(cut losses)，所以背离和不止损…