一、org.Hs.eg.db包載入失敗的原因
1、包未安裝
在使用 org.Hs.eg.db 包之前,需要確保已將其正確安裝到本地計算機。可以通過 Bioconductor 官網提供的命令行方式或者在 R 語言環境下的命令來完成安裝操作。
解決方法:確認 org.Hs.eg.db 包已經正確安裝,并通過 sessionInfo() 函數查看其所依賴的其他包是否正確安裝。
2、依賴包未安裝
在安裝 org.Hs.eg.db 之前,需要保證該包所依賴的其他 R 包同樣被安裝至本地計算機。
解決方法:如果缺少某個依賴包,可以使用 install.packages() 函數安裝缺失的包。
3、包版本不兼容
在某些情況下,org.Hs.eg.db 包的版本可能與其他相關的 R 包存在兼容性問題。此時需要升級或降級 org.Hs.eg.db 包以解決兼容性問題。
解決方法:如果出現兼容性問題,可以嘗試使用 BiocManager::install() 函數安裝或更新 org.Hs.eg.db 包。
4、路徑問題
路徑問題是比較常見的導致包載入失敗的原因之一。在載入 org.Hs.eg.db 包之前,需要確認路徑是否正確,并且當前用戶是否具有訪問該路徑的權限。
解決方法:確認路徑是否正確,并授予當前用戶訪問該路徑的權限。
二、org.Hs.eg.db包簡介
1、安裝載入
if("org.Hs.eg.db" %in% rownames(installed.packages()) == FALSE) {source("http://bioconductor.org/biocLite.R");biocLite("org.Hs.eg.db")}
suppressMessages(library(org.Hs.eg.db))
2、查看該包所有的對象
ls("package:org.Hs.eg.db")
功能:可以用來進行基因ID的轉換
org.Hs.egACCNUM:將 Entrez Gene ID 映射到 GenBank 序列訪問號org.Hs.egALIAS2EG:將基因符號映射到 Entrez Gene IDorg.Hs.eg.db:Bioconductor注釋數據包org.Hs.egCHR:將 Entrez Gene ID 映射到染色體編號org.Hs.egCHRLENGTHS:包含了每條染色體長度的命名向量org.Hs.egCHRLOC:將 Entrez Gene ID 映射到染色體位置org.Hs.egENSEMBL:將 Ensembl 基因訪問號映射到 Entrez Gene IDorg.Hs.egENSEMBLPROT:將 Ensembl 蛋白質訪問號映射到 Entrez Gene IDorg.Hs.egENSEMBLTRANS:將 Ensembl 轉錄本訪問號映射到 Entrez Gene IDorg.Hs.egENZYME:將 Entrez Gene ID 映射到酶名分類號org.Hs.egGENENAME:將 Entrez Gene ID 映射到基因名稱org.Hs.egGO:將 Entrez Gene ID 映射到Gene Ontology IDorg.Hs.egMAP:將 Entrez Gene ID 映射到細胞遺傳學圖譜的區段位置org.Hs.egMAPCOUNTS Number of:在 org.Hs.eg.db 包中的已映射鍵數org.Hs.egOMIM:將 Entrez Gene ID 映射到人類遺傳疾病 MIM IDorg.Hs.egORGANISM:org.Hs.eg 數據庫對應的生物種類為人類org.Hs.egPATH:將 Entrez Gene ID 映射到 KEGG 通路 IDorg.Hs.egPFAM:將基因訪問號映射到 PFAM IDorg.Hs.egPMID:將 Entrez Gene ID 映射到 PubMed 文獻 IDorg.Hs.egPROSITE:將基因訪問號映射到 PROSITE IDorg.Hs.egREFSEQ:將 Entrez Gene ID 映射到 RefSeq 序列訪問號org.Hs.egSYMBOL:將 Entrez Gene ID 映射到基因符號org.Hs.egUNIGENE:將 Entrez Gene ID 映射到 UniGene 群集訪問號org.Hs.egUNIPROT:將 Uniprot 訪問號映射到 Entrez Gene IDorg.Hs.eg_dbconn:收集有關包注釋數據庫的信息3、示例
用mget函數:
myEIDs <- c("1", "10", "100", "1000", "37690")mySymbols <- mget(myEIDs, org.Hs.egSYMBOL, ifnotfound=NA) #myEID是自己的ID,org.Hs.egSYMBOL是其中的一個對象mySymbols <- unlist(mySymbols)
用select函數:
myEIDs <- c("ENSG00000130720", "ENSG00000103257", "ENSG00000156414")cols <- c("SYMBOL", "GENENAME")select(org.Hs.eg.db, keys=myEIDs, columns=cols, keytype="ENSEMBL") #生成數據框
延伸閱讀1:數據分析常用R包
dplyr包ggplot2包stringr包data.table包tidyr包caret包cluster包和factoextra包arules包和arulesViz包