R：分类学等级解析与标准化脚本-编程知识

R：分类学等级解析与标准化脚本

news/2024/12/15 15:51:16/文章来源:https://www.cnblogs.com/wzbzk/p/18608065

rm(list = ls())
setwd("C:\\Users\\Administrator\\Desktop\\machine learning\\Network") #设置工作目录
library(dplyr)
library(tidyr)
library(readr)# 读取文件
data <- readLines('1.txt')# 定义分类等级的前缀和列名
prefixes <- c("k__", "p__", "c__", "o__", "f__", "g__", "s__")
levels <- c("Kingdom", "Phylum", "Class", "Order", "Family", "Genus", "Species")# 拆分并填充缺失的分类
split_data <- lapply(data, function(line) {# 初始化分类向量classification <- setNames(rep("unclassified", length(levels)), levels)# 遍历每个前缀for(i in seq_along(prefixes)) {prefix <- prefixes[i]pattern <- paste0(prefix, "([^|]+)")matches <- regmatches(line, gregexpr(pattern, line))# 如果找到匹配项，则更新分类if(length(matches[[1]]) > 0) {name <- gsub(prefix, "", matches[[1]])classification[levels[i]] <- name}}return(c(line, classification))
})# 将结果转换为数据框
result_df <- do.call(rbind, split_data)# 添加列名
colnames(result_df) <- c("Original_Classification", levels)# 转换为字符矩阵以便输出
result_matrix <- apply(result_df, 2, as.character)# 输出到txt文件，包括列名
write.table(result_matrix, 'path_to_output_file.txt', quote = FALSE, sep = "\t", row.names = FALSE, col.names = TRUE)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/853316.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

vs编译cpp时设置排除项

cpp编译排除一个c++文件不需要被编译但还保留在工程中(阅读)，可使用ExcludedFromBuild，有两种方法实现：图形化操作改vs的项目配置文件图形化操作在vs的资源管理器选中文件 - 右键 - 属性 - 切到当前的编译配置项（debug/release)，有个选项【从生成中排除】，选择为是…

纪念程云大侠

与程云兄的缘份，起始于Delphi大富翁论坛，因 “程云的一堆SQL”而结缘，在论坛发起的第二次（玉渊潭）和第三次（香山）大富翁聚会中逐渐相熟。自2002年5月3日那场坛友初聚起，加上中间各种小聚，至近年来的4年多共事时光，不经意间，二十余载岁月已悄然流逝，往昔匆匆，仿若弹…

css第三天案例练习

案例一：新闻详情字体颜色：color 字体大小:font-size 段落开头空两行:font-indent:2em 水平居中：图片（出错点）/文字text-align:center 字体粗细：font-weight:400(取消加粗)案例二：css简介超链接设置格式

DVR4 pg walkthrough Intermediate window

nmap ┌──(root㉿kali)-[~/lab] └─# nmap -p- -A -sS 192.168.219.179 Starting Nmap 7.94SVN ( https://nmap.org ) at 2024-12-15 04:22 UTC Stats: 0:00:22 elapsed; 0 hosts completed (1 up), 1 undergoing SYN Stealth Scan SYN Stealth Scan Timing: About 34.76% d…

计算机网络课程笔记

计算机网络课程该笔记于 2024年12月15日15:14:02 编写常用命令以及简写完整命令简写形式解释configure terminal conf t 进入全局配置模式enable en enableexit ex 退出当前模式hostname host 重启设备interface int 进入接口配置模式shutdown shut 禁用接口no shutdown no…

监测预警智能分析中心建设项目方案

随着科技的不断进步，地理信息与遥感技术在国家治理、环境保护、灾害预警等领域发挥着越来越重要的作用。监测预警智能分析中心的建设，旨在通过集成先进的遥感技术、地理信息系统（GIS）、大数据分析和人工智能（AI）技术，实现对环境变化、灾害风险的实时监测和智能预警。本文…

2024-2025-1 20241421《计算机基础与程序设计》第十二周学习总结

这个作业属于哪个课程 2024-2025-1-计算机基础与程序设计这个作业要求在哪里 2024-2025-1计算机基础与程序设计第十二周作业这个作业的目标复习巩固前面所学的内容作业正文 https://www.cnblogs.com/118qa/p/18608015 教材学习内容总结一、文件的基本概念文件是存储在外…

Three.js案例-360全景房看

在 360 看房功能中，我们需要在浏览器中创建一个类似虚拟现实的场景，使得用户能够查看环境的每一个角落。这一功能的实现本质上是利用球体映射技术，即通过将全景图作为纹理贴图映射到一个反向的球体上，用户可以通过旋转视角来“环顾四周”。我们先来看一下效果 ![file](Ma…

性能测试-内存溢出时的分析工具使用

下载内存分析工具地址：https://eclipse.dev/mat/downloads.phphp)下载对应的版本，我这里使用的windows的就下载windows版本的包，下载完成后解压配置启动时的jdk的依赖，目前1.15.0版本的需要jdk17以上，我们在启动时需要手工修改MemoryAnalyzer.ini文件，添加指定的jdk的本地…

性能测试-jvm监控工具jivsualvm

官方网站下载：https://visualvm.github.io/download.html下载zip文件解压到本地后，需要修改启动对应的系统环境的jdk的地址，visualvm_2110\etc 的目录下的 visualvm.conf 文件，配置当前环境的jdkhome后保存visualvm_2110\bin目录下，点击 visualvm.exe 启动程序安装GC插件 …

鲜花：16。

又老了一岁了。一下子就沧桑了许多。“低沉-狂喜-低沉-狂喜”的循环往复，终究是走向疯癫。接连三次的挫败，几乎毁了我的一切。终究是自己不够成熟导致的。生日，很想哭。失败，会更多。

性能测试-jvm监控工具jconsole

在jdk的bin目录下，运行jconsole.exe 程序可以打开工具在使用 java 命令启动服务时添加如下参数 -Dcom.sun.management.jmxremote # 启用 jmx -Djava.rmi.server.hostname=10.0.0.100 # 运行的服务器ip -Dcom.sun.management.jmxremo…

R：分类学等级解析与标准化脚本

相关文章