OmegaPlus 是一个用于检测基因组数据中正选择痕迹的生物信息学工具。基于单倍型频率分布和重组事件检测选择信号,通过计算ω统计量(omega statistic)来识别选择位点。
官方软件提供了几种不同的版本:
OmegaPlus:顺序版本;
OmegaPlus-F:细粒度并行版本,适合在在更小的任务单位上并行化;
OmegaPlus-C:粗粒度并行版本,在较大的任务块上分配工作,适合任务量较大的计算场景;
OmegaPlus-M:多粒度并行版本结合了细粒度和粗粒度的优点,通常在实际计算中性能表现最佳。
示例:
./OmegaPlus-M -name TEST -input TEST.fasta -minwin 100 -maxwin 1000 -grid 10000 -threads 4
-name: 设置输出文件的前缀,用于标记结果文件。
-input: 指定输入文件(例如基因组序列文件)。
-minwin 和 -maxwin: 设置扫描窗口的范围。
-grid: 决定基因组上划分的网格数量,值越大分辨率越高,但计算量也越大。
-threads: 指定线程数量(仅用于并行版本)
其它可选参数:
-name <STRING>
指定运行名称,生成的输出文件将以该名称作为前缀。
-input <STRING>
输入对齐文件的名称。
-grid <INTEGER>
指定在对齐中计算 omega 值的网格数,数值越大分辨率越高,但计算量更大。
-minwin <INTEGER>/-maxwin <INTEGER>
设置用于计算 SNPs 之间连锁不平衡值的最小和最大窗口大小。
-length <INTEGER>
指定对齐长度,仅适用于 MS-like 和 MaCS-like 输入文件。
-impute <N or GAP>
启用对N或GAP符号的随机插补,将它们转换为有效字符。
可以使用两次-impute分别处理N和GAP。
示例:-impute N -impute GAP。
-seed <INTEGER>
指定随机数种子,用于插补N和GAP符号,或将 DNA 对齐转化为二进制数据。
必须与-impute和-binary一起使用。
-binary
将 DNA 对齐数据转换为二进制格式。
-threads <INTEGER>
指定线程数,仅适用于并行版本 OmegaPlus-F、OmegaPlus-C 和 OmegaPlus-M。
-minsnps <INTEGER>
指定子区域内计算 omega 值的最小 SNP 数量。
示例:-minsnps 10。
-ld <STRING>
指定连锁不平衡的测量类型,支持以下选项:
RSQUARE(默认): SNPs 之间的相关系数 r²。
D: D 统计量。
ABSD: D 的绝对值。
DOM: D_omega 统计量。
ABSDOM: D_omega 的绝对值。
ABSDOM2: D_omega 的绝对值,按频率乘积归一化。
示例:-ld RSQUARE。
-maf <FLOAT>
排除次等位基因频率低于阈值的 SNP。
-no-singletons
从分析中排除单一出现的 SNPs。
-b <INTEGER>
允许每个位置在左、右窗口中 SNPs 数目差异不超过<INTEGER>,实现对最佳 omega 值的近似搜索。
-all
输出文件中显示更多结果信息。
-reports
为每个对齐生成单独的报告文件。
-sampleList <STRING>
用于 VCF 文件,指定需要包含的样本。
-sampleList_out <STRING>
为输入 VCF 文件生成样本列表。
-mbs
指定输入文件为 mbs 格式(将按 ms 格式处理)。
-noSeparator
禁止在输出中打印//分隔符,便于元处理(如在 R 中处理结果)。
案例:
Weng et al., 2024, Mol Biol Evol
Taliadoros et al., 2023, PLOS Genet
Sørensen et al., 2023, Sci