trouver récursivement une chaîne avec un caractère générique dans les fichiers Word Doc, sortie dans un fichier texte, comment se débarrasser des ordures Word?

Voici ce que j’essaie de faire:

  1. en utilisant cmd.exe, accédez à un lecteur réseau Windows monté
  2. il y a une hiérarchie de dossiers dans le répertoire de départ avec des fichiers .doc dans lesquels je veux rechercher une chaîne commençant par “CCMPD” et ayant ensuite des numéros uniques (numéros de défaut).
  3. La hiérarchie n’est pas cohérente, c’est-à-dire que certains dossiers ont le .doc au premier niveau, d’autres ont d’autres dossiers sous lesquels se trouve la doc.
  4. Affiche chaque ligne correspondante dans un fichier.

Je suis venu avec la commande en ligne de commande:

findstr / S “CCMPD” * .doc> D: \ Data \ FIND.txt

Cela fonctionne réellement (je suis assez fier de cela) mais le fichier est rempli avec la poubelle qui vit dans un document Word, et je ne peux pas comprendre comment le filtrer. Je ne peux même pas coller le résultat ici car ce ne sont pas des caractères imprimables mais vous les avez probablement tous déjà vus.

Comment puis-je créer une commande find qui peut filtrer les ordures Word et les produire dans un fichier facilement lisible?

essayez d’utiliser l’ outil Chaînes . Cela va extraire les cordes et se débarrasser des ordures.