Recruitment: Research Engineer in Data Science / Digital Humanities

The ERC ModERN project is looking to appoint a Research Engineer in Data Science and Digital Humanities to manage and enrich the project’s database and data-science pipelines. The candidate will have a strong background in data science for research applications, experience with graph and network modelling, and will be responsible for developing the project’s final platform, providing users access to the ModERN database. The platform will allow users to perform different data analyses using automatic language processing methods, including those using LLMs (various types of classification, semantic analyses, thematic analyses, clustering, etc.). The successful candidate will therefore be required to intervene using a variety of data-science techniques, knowledge of state-of-the-art NLP approaches, and new applications for generative artificial intelligences. Experience in the Digital Humanities, i.e., the application of computational methods to literary-historical data, is also highly desirable. The recruited person will also participate occasionally in the data processing and exploitation policy for the main ModERN project database. They will make proposals regarding relevant digital tools and consider specific developments if necessary. They will also provide technical support to the ModERN team in their research projects and ensure the development and maintenance of solutions from various fields such as data science, network analysis, and artificial intelligence. The recruited individual will play a training role for all ModERN actors regarding the tools implemented. This mission will be divided as follows: Main Activities: Develop a platform providing access to the ModERN project database. Design and develop a user-friendly interface for the ModERN project platform. Develop computational methods and data analysis tools for leveraging the database, focusing on network and graph analyses, as well as lexical/semantic analyses using LLMs. Propose IT solutions for digital tools in automatic text processing, network visualization, and other technical aspects of the project. Support the development of digital tools and documentation production: environment, data, tools, and procedures. Participate in the scientific production of the project (articles, white papers, etc.) and in writing technical specifications for the developed tools/methods. Engage in the scientific life of the team: training sessions, seminars, and workshops. Remuneration: Remuneration according to the recruitment salary scale for BIATSS contract employees at Sorbonne University. Start Date: November 2024. The contract is for 24 months, renewable. Required Documents: A cover letter (in French and/or English) addressed to the project leader (Glenn Roe) explaining the candidate’s interest in this research and the skills they intend to use to carry it out. A detailed CV. A copy of the document certifying the required level of education. The names and email addresses of two referees. Selection Criteria: A higher education degree or a Ph.D. in data science, computer science, computational linguistics, or a related field. Demonstrated skills in computational linguistics, machine/deep learning, network modeling, and programming (Python). An interest in French literature and intellectual history. Excellent communication skills. A good command of both French and English. Strong organizational skills. Selection Procedure: The required documents must be sent to the project leader Glenn Roe (glenn.roe *at* sorbonne-universite.fr) All documents must be submitted in PDF format by September 30, 2024. Incomplete applications or those submitted after the deadline will not be considered. Successful candidates will be informed by email no later than October 15, 2024, and will be invited to participate in interviews organized in Paris (or remotely) at the end of October 2024. VERSION FRANÇAISE Mission : Financé par le projet européen ERC ModERN, ce poste a pour objectif de renforcer le déploiement de la politique numérique de l’équipe du projet. Au sein du projet ModERN, la personne recrutée travaillera en étroite collaboration avec le PI et les autres membres de l’équipe. Son travail l’amènera aussi à collaborer avec divers services et partenaires de Sorbonne Université. La personne recrutée aura pour mission principale d’effectuer la gestion et l’enrichissement de la base de données du projet ModERN. En particulier, la personne aura une forte connaissance des méthodes d’analyse liées à la modélisation par graphe le « social network analysis ». Elle sera responsable du développement de la plateforme finale du projet qui donnera accès aux utilisateurs à la base de données ModERN. La plateforme mettre à disposition des chercheurs un moteur de recherche avec un système de filtre, des réseaux de co-présences textuelles interactifs, et d’autres outils de visualisation de la base de données en entier et des parties filtrées. Elle donnera également aux utilisateurs la possibilité d’effectuer des analyses différentes des données avec des méthodes numériques du traitement automatique de langues, aussi avec celles qui utilisent les LLMs (différents types de classification, analyses sémantiques, analyses thématiques, clusterisation etc.). La contribution de la personne recrutée représentera donc une intervention importante dans les domaines de la science des données et de la linguistique computationnelle. La personne recrutée participera aussi de manière ponctuelle à la politique de traitement et d’exploitation des données contenues dans la base de données principale du projet ModERN. Elle fera des propositions en matière d’outils numériques pertinents et envisagera si besoin des développements spécifiques. Elle saura également accompagner techniquement l’équipe ModERN dans ses projets de recherche et de réaliser le développement et la maintenance de solutions venant des divers domaines telle la science des données, l’analyse des réseaux et l’intelligence artificielle. La personne recrutée jouera un rôle de formation vis-à-vis de l’ensemble des acteurs ModERN en matière des outils mis en place. Cette mission sera décomposée de la manière suivante : Activités principales : – Développer une plateforme permettant un accès à la base de données du projet ModERN. – Concevoir et développer une interface « user-friendly » pour la plateforme du projet ModERN. – Développer des méthodes computationnelles et des outils d’analyse des données pour l’exploitation de la BDD, en s’y appuyant sur les analyses de réseaux et e graphes, ainsi que des analyses lexicales/sémantiques avec les LLMs. – Proposer des solutions informatiques en matière d’outils numériques pour le traitement automatique des textes, la visualisation des réseaux et autres éléments techniques du projet. – Accompagner le développement des outils numériques et de la production documentaire : environnement, données, outils … Continue reading Recruitment: Research Engineer in Data Science / Digital Humanities