Sans la DGX, nous n’aurions pas pu atteindre notre expertise actuelle et MAbSilico n’aurait pas progressé si rapidement. Désormais, nous pouvons résoudre des problématiques que les biologistes des compagnies pharmaceutiques se posent. Leur proposer des solutions avec nos capacités d’entrainement qui sont aujourd’hui plus importantes…
Dr Thomas BOURQUARD, Co-fondateur et CSO Computer science, MAbSilico.
PORTRAIT.
Après une thèse réalisée à Paris XI à l’institut de recherche de biologie moléculaire et cellulaire (IBBMC), Thomas BOURQUARD s’est consacré à différents projets de recherche en « computer sciences » dans des laboratoires de l’INRIA à Nancy et de l’INRA de Tours. Il a pu notamment y rencontrer et travailler avec Vincent PUARD - CEO MAbSilico, Astrid MUSNIER - Head of Biology MAbSilico et Anne Poupon - CTO MAbSilico. Thomas BOURQUARD partira par la suite aux Etats-Unis, où il y restera un peu plus de 4 ans, pour travailler sur l’intégration de l’IA dans les études de génomiques dans les domaines de l’infectiologie et des maladies neurodégénératives. La création de MAbSilico se fera en parallèle de ses recherches, à la suite d’un projet initié lors de son travail avec Astrid MUSNIER. Le développement de la société se concrétisera grâce notamment au renforcement des partenariats avec les académiques, les biotechnologies, le CHRU de Tours, etc. |
MAbSilico(1) est une entreprise française de Deeptech fondée par 4 chercheurs en 2017. Ils conçoivent et mettent en oeuvre des solutions informatiques pour la découverte et le développement de biomédicaments et plus particulièrement des anticorps.
Leur concept est de pouvoir fournir des technologies d’IA intégrées pour la découverte d’anticorps, domaine dans lequel ils sont leaders mondiaux. Cette approche permet de réduire les risques d’échec au développement de médicaments qui est généralement de 95%, ainsi que la durée de la découverte et des étapes précliniques, tout en renforçant la protection de la propriété intellectuelle.
Depuis sa création, MAbSilico collabore sur 10 programmes de recherche réalisés en France, en Europe et aux Etats-Unis, visant à lutter notamment contre le cancer, les maladies infectieuses ou la modulation de la reproduction. Ils ont également à leur actif plus d’une cinquantaine de clients dans le monde, allant de la startup au laboratoire pharmaceutique.
Installés déjà sur deux sites, ils ont pour projet en 2023 de s’installer à Paris. Un projet réalisable, grâce au soutien de la société pharmaceutique NOVO NORDISK et qui leur permet de pouvoir bénéficier de laboratoires et de bureaux au Biolabs de l’hôtel Dieu pouvant accueillir notamment des calculateurs tels que la DGX NVIDIA A100 de chez Bechtle.
MAbSilico s’intéresse à une cible thérapeutique précise ou bien pour le compte d’un client. C’est à partir de ce prisme qu’ils vont pouvoir concevoir informatiquement de nouvelles séquences, de nouveaux anticorps pour lutter contre cette cible.
Les anticorps en quelques chiffres :
|
L’objectifs de l’informatique est donc de réduire le temps, les coûts et surtout le taux de 95% d’échecs dans le développement des médicaments. Des paramètres « essentiels pour le bien être des patients et pour s’assurer que le coût des investissements sera couronné de succès » Vincent PUARD, CEO MAbSilico.
Certaines étapes propres à la découverte d’anticorps n’étaient plus réalisables sans l’appel d’une solution tout autant performante que dans un usage HPC que dotée d’une forte capacité d’analyse par IA.
Si l’on place la solution DGX NVIDIA A100 dans ce schéma, l’enjeu est donc le suivant : une cible thérapeutique ou un anticorps, est une série de lettres qu’il faut pouvoir retranscrire d’un point de vue 3D. Une fois la retranscription établie, on va pouvoir faire rejoindre la cible thérapeutique à un anticorps pour voir comment ils vont interagir ensemble. À première vue cela paraît simple, lorsque cela est effectué sur un faible nombre d’entités, mais sur des millions cela reste largement discutable.
Les enjeux de ce projet étaient donc les suivants :
|
LA SOLUTION.
La station DGX NVIDIA A100 est un centre de données prêt à l’emploi pour l’IA qui a été déployée dans le but d’apporter une puissance de calcul sans précédent. Elle offre des performances considérables digne d’un data center sans pour autant avoir besoin d’une infrastructure informatique supplémentaire. Une solution novatrice qui permet à MAbSilico d’accélérer tous leurs projets
et d’obtenir des résultats optimaux plus rapidement.
Les caractéristiques de la solution :
- 2,5 petaFLOPS de performance sans limite d’utilisation.
- 64-CORE AMD CPU and PCIE GEN4, 3,2x plus de coeur pour alimenter plusieurs utilisateurs et les travaux d’IA les plus intensifs.
- 512 Go de mémoire système.
- Refroidissement par réfrigération.
- Une plateforme d’IA de classe mondiale, qui ne nécessite pas d’installation complexe, ni d’aide informatique particulière.
- Seul système au monde doté de 4 processeurs NVIFDIA A100 T entièrement interconnectés et pouvant aller jusqu’à 320 gigaoctet (Go) de mémoire GPU.
- 7,68 Téraoctets (TB) PCIE GEN4. NVME SOLID -STATE DRIVE (SSD). Cela offre des performances de stockage de 1,4 M IOPS, soit 2 fois plus rapide que les SSD NVMe PCIe Gen3.
Ce que je peux dire, c’est que depuis que nous avons reçu la machine, nous
avons déjà cumulé plus de 4 Téraoctets de données et nous parvenons désormais
à entrainer de nouveaux modèles pour répondre aux besoins de l’industrie biopharmaceutique.
Thomas BOURQUARD, CSO Computer science, MAbSilico.
Le standard aujourd’hui est le GPU(4) avec 2 à 3 millions de paramètres à entrainer. La notion de mémoire est donc importante pour MAbSilico. Ils ont pu atteindre jusqu’à 80% à 93% de bonnes prédictions dans la reconnaissance des zones les plus favorables pour la reconnaissance d’un épitope (antigène) par un paratope (anticorps) avec à la solution, qu’ils ont pu découvrir grâce à NVIDIA par le biais du programme Inception. Plusieurs sociétés pouvant leur fournir le matériel adéquat leur ont été présentées. S’en suivra une prise de contact efficace et rapide avec Bechtle, qui a été sélectionné pour les accompagner sur toute la durée du projet.
Selon Vincent PUARD, CEO MAbSilico, ce qui a également été décisif dans leur choix, c’est le fait que Bechtle ait pu leur donner la possibilité de tester la machine pendant quelques semaines, afin de s’assurer qu’elle répondait bien à leurs besoins avant de pouvoir s’engager de manière plus concrète.
Une partie support est également incluse dans le contrat initial. Une force de taille, qui permet à MAbSilico d’avoir aussi accès aux meilleurs experts.
(1) MAbSilico : vient de la contraction de deux mots, MAb : monoclonal antibody (anticorps monoclonal) / Silico : modèles informatiques.
(2) Anticorps thérapeutique : aussi appelés anticorps monoclonaux (Acm) et leurs dérivés, représentent la majorité des protéines thérapeutiques actuellement utilisés dans le cadre de la lutte contre le cancer. Ils font partie des produits connues également sous le nom de biomédicaments.
(3) Scalabilité : se dit d’un système informatique (ou de l’un de ses composants aptes à s’adapter d’un point de vue dimensionnel.
(4) GPU : aussi appelé coprocesseur graphique sur certains systèmes, est une unité de calcul pouvant être présente sous forme de circuit intégré sur une carte graphique ou carte mère.