À partir des fichiers numériques fournis par Stanford (et utilisés pour leur propre projet) pour les volumes 1 à 82, la BIS a entamé un double travail de relevé des noms en gras ou en capitales (personnes prenant la parole lors des séances parlementaires), lesquels alimentent un index, et de séquençage de l’intégralité du texte. Les principes du balisage ont été établis par les chercheurs/ses de l’IHRF et se sont matérialisés par un glossaire de 33 entrées qui ont fait l’objet d’une définition détaillée. Chaque parcelle du texte se voit attribuer l’un des 33 qualificatifs du glossaire. Ce glossaire, accompagné d’explications sur sa construction, est disponible en ligne.
Les agents de la BIS ont alors démarré l’indexation des noms et le séquençage du texte dans l’outil fourni par Persée, jGalith. Persée s’est quant à elle chargée de tous les traitements informatiques, de l’intégration des fichiers numériques à la mise en ligne en passant par l’alignement des auteurs sur les référentiels nationaux ou internationaux faisant autorité.
À la fin de cette première phase, les 20 premiers volumes étaient en ligne. Le résultat du travail était en ligne sur le portail généraliste Persée.