Die Verteilung, Vielfalt und Klassifikation von Encapsulin-Systemen, die in Prokaryoten gefunden wurden, wurden in dieser Studie analysiert. Alle prokaryotischen Proteome in der UniProtKB18-Datenbank wurden nach dem Vorhandensein von encapsulinartigen Proteinen mithilfe einer HMM-basierten Suchstrategie untersucht. Es wurde festgestellt, dass alle Pfam-Familien, die mit den initialen Suchergebnissen in Verbindung standen, zu einem einzigen Pfam-Clan gehören, der den Großteil der HK97-Faltproteine catalogisiert. Anhand der Sequenzähnlichkeit und der Pfam-Familienzugehörigkeit der identifizierten Kapsidproteine und der Genom-Nachbarschaftszusammensetzung der zugehörigen Operons konnten Encapsulin-ähnliche Systeme in vier unterschiedliche Familien eingeteilt werden. Family 1 und 2 repräsentieren zuvor identifizierte Encapsulin-Operontypen, die falsch als Bacteriocin oder Transkriptionsregulator/Membranprotein annotiert wurden. Family 3 und 4 sind neu entdeckte Systeme, die jeweils andere Funktionen und Strukturen aufweisen. Es wurden insgesamt 6,133 Encapsulin-ähnliche Proteine identifiziert, die in 31 bakteriellen und 4 archäischen Phyla vorkommen. Encapsulins sind weit verbreitet und spielen wahrscheinlich wichtige Funktionen in der Zellphysiologie von Prokaryoten. Es wurde auch gezeigt, dass bestimmte Pathogene Encapsulins besitzen, die für die Stressresistenz und Nährstoffnutzung wichtig sind.
Die Klassischen Encapsulins (Family 1) sind am weitesten verbreitet und kommen in 31 von 35 prokaryotischen Phyla vor. Sie enthalten mindestens sechs verschiedene Operontypen mit sechs verschiedenen konservierten Frachproteinen. Family 2 Encapsulins sind zahlreicher und in 14 bakteriellen Phyla zu finden. Sie enthalten mindestens vier verschiedene Operontypen basierend auf der Identität des Frachproteins. Natural Product Encapsulins (Family 3) werden fast ausschließlich in den Phyla Actinobacteria und Proteobacteria gefunden, während A-domain Encapsulins (Family 4) auf die archaeische Phylum Euryarchaeota und das bakterielle Phylum Bacteroidetes beschränkt sind.
Die Klasse Family 3 ist neu entdeckt und scheint in BGCs verschiedener natürlicher Produkte codiert zu sein. Family 4 A-Domänen-Encapsulins sind die am deutlichsten identifizierbare Art Encapsulin-ähnlicher Systeme. Sie sind in Archaeen von hyperthermophilen Organismen gefunden und haben einzigartige Eigenschaften, die sie von anderen Encapsulins unterscheiden. Durch phylogenetische Analysen und strukturelle Vergleiche konnte gezeigt werden, dass die Encapsulins mit Familie 1, 2 und 3 HK97-Faltproteinen geschätzt werden können. Encapsulins könnten also von Viruskapsidproteinen domestiziert worden sein und kehren möglicherweise zu ihrer zellulären Ursprung zurück. Neben ihrer evolutionären Bedeutung spielen Encapsulins auch eine Rolle in der Pathogenität und Virulenz von einigen wichtigen Krankheitserregern. Die vielfältigen Funktionen und Strukturen dieser Encapsulin-ähnlichen Systeme machen sie zu interessanten Zielen für zukünftige therapeutische Interventionen.