MolecularEvolution

A Julia package for the flexible development of phylogenetic models.

MolecularEvolution.jl exploits Julia's multiple dispatch, implementing a fully generic suite of likelihood calculations, branchlength optimization, topology optimization, and ancestral inference. Users can construct trees using already-defined data types and models. But users can define probability distributions over their own data types, and specify the behavior of these under their own model types, and can mix and match different models on the same phylogeny.

If the behavior you need is not already available in MolecularEvolution.jl:

If you have a new data type:
- A Partition type that represents the uncertainty over your state.
- combine!() that merges evidence from two Partitions.
If you have a new model:
- A BranchModel type that stores your model parameters.
- forward!() that evolves state distributions over branches, in the root-to-tip direction.
- backward!() that reverse-evolves state distributions over branches, in the tip-to-root direction.

And then sampling, likelihood calculations, branch-length optimization, ancestral reconstruction, etc should be available for your new data or model.

Design principles

In order of importance, we aim for the following:

Flexibility and generality
- Where possible, we avoid design decisions that limit the development of new models, or make it harder to develop new models.
- We do not sacrifice flexibility for performance.
Scalability
- Analyses implemented using MolecularEvolution.jl should scale to large, real-world datasets.
Performance
- While the above take precedence over speed, it should be possible to optimize your Partition, combine!(), BranchModel, forward!() and backward!() functions to obtain competative runtimes.

Authors:

Venkatesh Kumar and Ben Murrell, with additional contributions by Sanjay Mohan, Alec Pankow, Hassan Sadiq, and Kenta Sato.

Quick example: Likelihood calculations under phylogenetic Brownian motion:

using MolecularEvolution, Plots

#First simulate a tree, using a coalescent process
tree = sim_tree(n=200)
internal_message_init!(tree, GaussianPartition())
#Simulate brownian motion over the tree
bm_model = BrownianMotion(0.0,1.0)
sample_down!(tree, bm_model)
#And plot the log likelihood as a function of the parameter value
ll(x) = log_likelihood!(tree,BrownianMotion(0.0,x))
plot(0.7:0.001:1.6,ll, xlabel = "variance per unit time", ylabel = "log likelihood")

MolecularEvolution.BranchlengthSampler
MolecularEvolution.LazyDown
MolecularEvolution.LazyPartition
MolecularEvolution.LazyUp
Base.:==
MolecularEvolution.SWM_prob_grid
MolecularEvolution._mapreduce
MolecularEvolution.backward!
MolecularEvolution.backward!
MolecularEvolution.bfs_mapreduce
MolecularEvolution.branchlength_optim!
MolecularEvolution.branchlength_optim!
MolecularEvolution.brents_method_minimize
MolecularEvolution.cascading_max_state_dict
MolecularEvolution.cascading_max_state_dict
MolecularEvolution.char_proportions
MolecularEvolution.collect_leaf_dists
MolecularEvolution.colored_seq_draw
MolecularEvolution.combine!
MolecularEvolution.combine!
MolecularEvolution.copy_tree
MolecularEvolution.deepequals
MolecularEvolution.dfs_mapreduce
MolecularEvolution.discrete_name_color_dict
MolecularEvolution.draw_example_tree
MolecularEvolution.endpoint_conditioned_sample_state_dict
MolecularEvolution.endpoint_conditioned_sample_state_dict
MolecularEvolution.expected_subs_per_site
MolecularEvolution.felsenstein!
MolecularEvolution.felsenstein_down!
MolecularEvolution.forward!
MolecularEvolution.forward!
MolecularEvolution.gappy_Q_from_symmetric_rate_matrix
MolecularEvolution.get_highlighter_legend
MolecularEvolution.get_max_depth
MolecularEvolution.get_phylo_tree
MolecularEvolution.get_phylo_tree
MolecularEvolution.golden_section_maximize
MolecularEvolution.highlight_seq_draw
MolecularEvolution.highlighter_tree_draw
MolecularEvolution.internal_message_init!
MolecularEvolution.internal_message_init!
MolecularEvolution.istreeconsistent
MolecularEvolution.lazyprep!
MolecularEvolution.lazysort!
MolecularEvolution.leaf_distmat
MolecularEvolution.linear_scale
MolecularEvolution.log_likelihood
MolecularEvolution.log_likelihood!
MolecularEvolution.longest_path
MolecularEvolution.marginal_state_dict
MolecularEvolution.marginal_state_dict
MolecularEvolution.matrix_for_display
MolecularEvolution.metropolis_sample
MolecularEvolution.midpoint
MolecularEvolution.mix
MolecularEvolution.name2node_dict
MolecularEvolution.newick
MolecularEvolution.newick
MolecularEvolution.nni_optim!
MolecularEvolution.nni_optim!
MolecularEvolution.node_distances
MolecularEvolution.nonreversibleQ
MolecularEvolution.parent_list
MolecularEvolution.partition2obs
MolecularEvolution.partition2obs
MolecularEvolution.plot_multiple_trees
MolecularEvolution.plot_multiple_trees
MolecularEvolution.populate_tree!
MolecularEvolution.populate_tree!
MolecularEvolution.promote_internal
MolecularEvolution.quadratic_CI
MolecularEvolution.quadratic_CI
MolecularEvolution.read_fasta
MolecularEvolution.read_fasta
MolecularEvolution.read_newick_tree
MolecularEvolution.read_newick_tree
MolecularEvolution.reversibleQ
MolecularEvolution.reversibleQ
MolecularEvolution.root2tip_distances
MolecularEvolution.sample_down!
MolecularEvolution.sample_down!
MolecularEvolution.sample_from_message!
MolecularEvolution.savefig_tweakSVG
MolecularEvolution.savefig_tweakSVG
MolecularEvolution.savefig_tweakSVG
MolecularEvolution.shortest_path_between_nodes
MolecularEvolution.sibling_inds
MolecularEvolution.siblings
MolecularEvolution.sim_tree
MolecularEvolution.sim_tree
MolecularEvolution.sim_tree
MolecularEvolution.simple_radial_tree_plot
MolecularEvolution.simple_tree_draw
MolecularEvolution.total_LL
MolecularEvolution.tree2distances
MolecularEvolution.tree2shared_branch_lengths
MolecularEvolution.tree_draw
MolecularEvolution.tree_draw
MolecularEvolution.tree_polish!
MolecularEvolution.tree_polish!
MolecularEvolution.unc2probvec
MolecularEvolution.unc2probvec
MolecularEvolution.univariate_maximize
MolecularEvolution.univariate_maximize
MolecularEvolution.univariate_sampler
MolecularEvolution.values_from_phylo_tree
MolecularEvolution.values_from_phylo_tree
MolecularEvolution.weightEM
MolecularEvolution.write_fasta
MolecularEvolution.write_fasta
MolecularEvolution.write_nexus
MolecularEvolution.write_nexus

MolecularEvolution.BranchlengthSampler — Type

BranchlengthSampler

A type that allows you to specify a additive proposal function in the log domain and a prior distrubution over the log of the branchlengths. It also holds the acceptance ratio acc_ratio (acc_ratio[1] stores the number of accepts, and acc_ratio[2] stores the number of rejects).