La collecte proprement dite du corpus est précédée d'une phase de réflexion visant une meilleure compréhension du contexte et du matériau à collecter. Cette étape est déjà entamée depuis début 2009. La constitution du corpus se fait sur la base d'hypothèses de travail selon des critères bien définis (homogénéité, pertinence, contrastivité). Cette réflexion constitue le premier moment de cette tâche : il s'agit de faire des enquêtes de terrain pendant un mois environ, afin d'améliorer la compréhension des pratiques d'écriture des travailleurs sociaux, des étapes de travail constituant l'activité de rédaction, mais aussi afin de faire un travail didactique auprès des travailleurs sociaux, leur présenter le projet et la méthodologie de recueil du corpus (pour les travailleurs sociaux qui ne participent pas encore au recueil du corpus). La première réunion de travail avec les professionnels au sujet des pratiques d'écriture a eu lieu en juin 2009. Une autre réunion est prévue pour le mois de mars 2010.
La question du paradoxe de l'observateur se pose dans ce contexte. Comme les scripteurs sont directement impliqués dans le processus de recueil du corpus, parce qu'il leur est demandé d'enregistrer les différentes versions de leurs rapports ou parce qu'ils rédigent leur texte directement sur un logiciel comme Inputlog, le risque existe que cette implication fausse le rapport entre observation et réalité (Labov 1973), en modifiant par exemple la démarche d'écriture et le rapport au texte. Deux éléments interviennent ici : le support/médium et le contexte « artificiel » d'observation qui éloignerait la pratique de son contexte naturel de réalisation. Si le problème ne semble pas être soluble dans sa globalité, un certain nombre d'éléments nous permet d'affirmer que les données resteraient intéressantes pour l'analyse et ne seraient pas soumises à une déformation préjudiciable. Premièrement, comme cela a pu être noté par les chercheurs travaillant sur l'oral, les locuteurs « oublient » relativement vite la présence du médium (appareil d'enregistrement, par exemple). Deuxièmement, les pratiques d'enregistrement et de rédaction sur logiciel ne constituent pas des démarches très éloignées des gestes habituels et les adaptations récentes (passer de l'écriture manuscrite à l'écriture par ordinateur constitue peut-être un saut plus important et marquant en termes de pratiques). Troisièmement, les travailleurs sociaux ont l'habitude de soumettre leurs écrits à l'évaluation de leurs pairs en réunion de travail et s'adressent à un destinataire multiple (juges, famille, pairs, chef de service...). Enfin, nous sommes conscients du fait que le point de vue du chercheur détermine le choix du corpus et la définition de l'objet de recherche (voir Mouchon 1985, Gadet 2003) : il serait naïf de considérer que l'on a accès à des données pures qu'il suffit d'analyser de la manière la plus objective possible ; nous prendrons donc en compte cet écueil aussi bien lors de la collecte du corpus que lors de l'analyse des données.
La nature du corpus (travail social) nous impose une charte éthique stricte. Ainsi, nous avons signé une convention de partenariat comprenant une clause de confidentialité : les écrits seront anonymisés de façon à éliminer toute identification possible de personnes faisant l'objet de signalement. Seront donc supprimées et remplacées toutes informations relatives au patronyme, à la fratrie, au lieu de résidence, au lieu de scolarité et aux institutions fréquentées et à l'identité du scripteur (voir tâche 2). Les travailleurs sociaux bénéficient d'une présentation détaillée du projet5 avant de s'engager dans la collaboration et de procéder à l'enregistrement de leurs propres écrits qu'ils nous cèdent à la fin du processus de rédaction. Nous nous sommes également engagés à fournir à nos partenaires un rapport des résultats de la recherche avant toute diffusion.