Nous construisons une base de données bio-acoustique d'origine éthique pour comprendre les maladies comme jamais auparavant !
La voix humaine est souvent considérée comme une empreinte unique pour chaque individu et contient des biomarqueurs qui ont été associés à diverses maladies allant de la maladie de Parkinson à la démence, en passant par les troubles de l'humeur et les cancers. La voix contient des marqueurs acoustiques complexes qui dépendent de la coordination entre la respiration, la phonation, l'articulation et la prosodie. Les progrès récents de la technologie d'analyse acoustique, en particulier ceux liés à l'apprentissage automatique, ont permis de mieux comprendre la détection des maladies. En tant que biomarqueur, la voix est unique, rentable, facile et sûre à collecter dans des environnements à faibles ressources. En outre, la voix humaine ne contient pas seulement la parole, mais aussi d'autres biomarqueurs acoustiques tels que les bruits respiratoires et la toux.
Un nombre croissant de start-ups spécialisées dans l'IA utilisent la voix et d'autres données acoustiques, telles que les bruits de toux, pour dépister des affections telles que le burn-out, les pathologies vocales et, plus récemment, le COVID-19. Bien que les résultats préliminaires soient prometteurs, la recherche sur l'IA vocale se heurte encore à de nombreuses limites. À l'heure actuelle, la plupart des bases de données vocales disponibles sont de petite taille et de qualité acoustique douteuse, manquent d'étiquetage des données pour plus d'une condition et représentent souvent une seule population homogène. La voix est considérée comme un identifiant biométrique soumis à la réglementation HIPAA, ce qui limite les collaborations multi-institutionnelles en raison de considérations éthiques - et entrave finalement la création d'ensembles de données vocales accessibles, robustes et diversifiées.
Pour que la voix devienne un biomarqueur de la santé, il est urgent de disposer d'une grande base de données vocales de haute qualité, multi-institutionnelle et diversifiée, liée à d'autres biomarqueurs de la santé provenant de données de différentes modalités (démographie, imagerie, génomique, facteurs de risque, etc.) afin d'alimenter la recherche sur l'IA vocale et de répondre à des questions cliniques tangibles. ) afin d'alimenter la recherche sur l'IA vocale et de répondre à des questions cliniques concrètes. Une telle entreprise n'est réalisable que grâce à des collaborations multi-institutionnelles entre des experts de la voix et des ingénieurs en IA, soutenus par des bioéthiciens et des spécialistes des sciences sociales afin de garantir la création de bases de données vocales éthiques représentatives de nos populations.
Notre groupe vise à faire de la voix un biomarqueur de la santé utilisé dans les soins cliniques. Pour ce faire, nous créerons une vaste base de données vocales multi-institutionnelle, éthique et diversifiée, liée à des biomarqueurs de santé multimodaux, afin d'alimenter la recherche sur l'IA vocale. Nous construirons ensuite des modèles prédictifs pour aider au dépistage, au diagnostic et au traitement d'un large éventail de maladies, y compris plusieurs maladies dont les besoins cliniques ne sont pas satisfaits. La collecte de données sera rendue possible par le développement d'un logiciel de pointe disponible sous forme d'application pour smartphone reliée aux dossiers médicaux électroniques (EHR). La collecte de données sera combinée avec d'autres biomarqueurs de santé tels que la radiomique et la génomique. Il est important de noter que ce projet sera le premier à utiliser la technologie d'apprentissage fédéré pour créer des modèles d'apprentissage automatique multicentriques tout en protégeant strictement la confidentialité des données. Les préoccupations éthiques croissantes concernant l'IA vocale, telles que les implications juridiques de l'identification vocale, le piratage de l'IA vocale, le partage des données vocales et la protection de la vie privée, ainsi que l'impact de la diversité raciale et de genre sur l'IA vocale, seront abordées.
Sur la base de la littérature existante et des recherches en cours dans différents domaines de la recherche sur la voix, notre groupe a identifié 5 catégories de cohortes de maladies pour lesquelles des modifications de la voix ont été associées à des maladies spécifiques avec des besoins non satisfaits bien reconnus. Nous concentrerons nos efforts d'acquisition de données sur les catégories de maladies suivantes :
Troubles de la voix : (Cancers du larynx, paralysie des cordes vocales, lésions bénignes du larynx)
Troubles neurologiques et neurodégénératifs : (Alzheimer, Parkinson, AVC, SLA)
Troubles de l'humeur et troubles psychiatriques : (dépression, schizophrénie, troubles bipolaires, etc.
Troubles respiratoires : (Pneumonie, BPCO, insuffisance cardiaque)
Troubles pédiatriques de la voix et de la parole : (Retards de la parole et du langage, autisme)
Alors que la voix est de plus en plus reconnue comme un biomarqueur de la santé par le monde de la technologie et que l'IA vocale attire l'attention de multinationales telles que Google, Amazon, Mozilla et Apple, entre autres, de nombreuses questions importantes liées à la protection de la vie privée des patients, à la représentation éthique et équitable de la population et à la précision clinique se posent. En tant que groupe multidisciplinaire d'experts universitaires, nous souhaitons influencer et guider le monde de l'IA vocale en garantissant la protection des patients grâce à des principes éthiques et équitables et en créant des infrastructures sûres et innovantes afin de diffuser des données éthiques pour les futures générations de chercheurs dans le domaine de l'IA vocale.
Vous voulez en savoir plus ?