2025年7月10日 星期四

Haplotype Network經驗

 Haplotype Network經驗

1. R的幾個套件對於圖形美編,都不如以下的套裝軟體直接以及美觀。當node多的時候,總是會有較多edge或是node交叉、重疊或是聚集成叢。

[需要嘗試igraph]


2. popart:

Leigh, J. W., & Bryant, D. (2015). POPART: Full-feature software for haplotype network construction. Methods in Ecology and Evolution, 6(9), 1110–1116. https://doi.org/10.1111/2041-210X.12410


方法:MSN, median-joining network, TCS, ancestral MP, integer NJ net, tight span walker等

美編:可呈現比例、顏色、大小,幾乎可以直接發表或是Inkscape稍微編輯

input: nexus, phylip格式

存成:svg, pdf, png

特徵長度限制:?,Sanger定序目前夠用,若太長可以只保留有變異的位置(例如使用MEGA)

怪脾氣:檔案的所有路徑、檔名不可以有中文(Windows、Ubuntu之下執行都一樣)



3. TCS

Clement, M., Posada, D., & Crandall, K. A. (2000). TCS: A computer program to estimate gene genealogies. Molecular Ecology, 9(10), 1657–1659. https://doi.org/10.1046/j.1365-294x.2000.01020.x


方法:就是只有TCS

美編:output無法直接使用,是所有軟體裡面最差的,但是輸出成*.gml配合tcsBU就可以

input: nexus, phylip格式

存成:gml, postscript, pict


4. FastHaN:

Chi, L., Zhang, X., Xue, Y., & Chen, H. (2025). fastHaN: A fast and scalable program for constructing haplotype network for large-sample sequences. Molecular Ecology Resources, 25(5), e13829. https://doi.org/10.1111/1755-0998.13829


方法:original_tcs (Clement's TCS), modified_tcs (PopART TCS), msn (PopART), mjn (PopART)。

美編:只有2個輸出檔輸出成*.gml與*.json,再將gml配合tcsBU就可以(附贈tcsBU,解壓縮之後執行index.html)

input:只吃PHYLIP格式

其他:You can use the Python script of GenNetworkConfig.py to generate two config files required by tcsBU. 

評論:只是將PopART的輸出能存成gml格式,是有市場需求的產品。可以分析genomics的大量數據


5. HapNetworkView

Chi, L., Dong, Y., Wang, R., Yang, S., Wu, L., Xue, Y., & Chen, H. (2025). HapNetworkView: A tool for haplotype network exploration and visualization. BMC Genomics, 26(1), 52. https://doi.org/10.1186/s12864-025-11206-8


方法:Java程式,容易有支援版本問題。"We integrated fastHaN to construct a haplotype network,..."

美編:可以顯示node name, link step number, color...

缺點:不能依照頻率改變node圈的大小,是依照分支數目。也沒得選方法,或是要由FastHaN的gml做美編

其他:genomics 數據大的時候可以用


6. tcsBU

Santos, AM, Cabezas MP, Tavares AI, Xavier R, Branco M (2016) tcsBU: a tool to extend TCS network layout and visualization. Bioinformatics, btv636 (doi: 10.1093/bioinformatics/btv636)


方法:就是只有美編功能。online: https://www.fc.up.pt/pessoas/amsantos/tcsBU/

input: gml

存成:svg

評論:對TCS與FastHaN而言,最重要的美編工具,能把gml格式的樹呈現幾乎可以直接發表或是Inkscape稍微編輯。

缺點:無法在圖上顯示haplotype name,如果是大量數據還是可以接受

怪脾氣:TCS的network有時候會有不連接在一起的node或是node group,不管connection limit如何設定(90-99%或是step)都很難取得完整的、好看的net,step設太高會產生複雜交錯的網路難以使用。但是改用FastHaN的 original TCS就沒有問題(但是step又無法顯示!待解決)。

先load group.csv的顏色設定,再load haplotype.csv才會顯示



總結論: 

最佳:單獨使用PopART (傳統直線形link) [繞了一圈又回到原點]。

或是 FastHaN + tcsBU (彎曲的link)  [genomics data適合用]