Articles of split

unix parsing un fichier texte et divisé en plusieurs fichiers en fonction du motif

J’ai un fichier comme celui-ci et je veux diviser le fichier en plusieurs fichiers en fonction d’un motif. Chaque bloc contient des informations sur un ( Job Number = ), la première ligne ayant ses informations parentales comme ceci: %HOSTNAME#PARENT_UNIQUE_ID_xxxxxx.JOB_NAME Je veux extraire les lignes entre %HOSTNAME#PARENT_UNIQUE_ID_xxxxxx.JOB_NAME y compris la ligne %HOSTNAME#PARENT_UNIQUE_ID_xxxxxx.JOB_NAME . Voici ce […]

Comment parsingr une ligne – le contenu entre guillemets ou un motif utilisant unix

J’essaie de saisir du contenu dans du texte formaté. Exemple entrée dans le fichier: i would like to say (“hi”) i am leaving, (“bye”) who is there? (“crazy cat”) I have a (“dirty dog that needs water”) // Comment puis-je ne récupérer que la chaîne qui se trouve dans (“”). J’ai essayé de l’parsingr par […]

Pendant la lecture de la ligne, awk $ line et écrire dans la variable

J’essaie de diviser un fichier en différents fichiers plus petits en fonction de la valeur du cinquième champ. Une très belle façon de faire cela a déjà été suggérée et aussi ici . Cependant, j’essaie de l’intégrer dans un script .sh pour qsub, sans grand succès. Le problème est que dans la section où le […]

Comment diviser un énorme fichier en fichiers plus petits par ordre alphabétique?

J’ai un fichier de 1 Go plein de noms d’artistes et de leurs chansons délimitées par des tabs. Artist1 Song1 Song2 Song3 … Artist2 Song1 Song2 Song3 … Et je veux diviser le gros fichier en 26 fichiers plus petits différents par ordre alphabétique. Par exemple, je veux que tous les artistes commencent par A […]

unix partage FASTA en utilisant une boucle, awk et split

J’ai une longue liste de données organisée comme ci-dessous (INPUT). Je veux diviser les données pour obtenir une sortie comme ci-dessous (OUTPUT souhaité). Le code ci-dessous identifie d’abord toutes les lignes contenant “> gi” et enregistre le compte de lignes de ces lignes dans un tableau appelé B. Ensuite, dans un nouveau fichier, il doit […]

Fractionner le fichier sans séparer les lignes commençant par des valeurs identiques dans Unix

J’ai un fichier .csv sortingé qui ressemble à ceci: AABB1122,ABC,BLAH,4 AABB1122,ACD,WHATEVER,1 AABB1122,AGT,CAT,4 CCDD4444,AYT,DOG,4 CCDD4444,ACG,MUMMY,8 CCEE4444,AOP,RUN,5 DDFF9900,TUI,SAT,33 DDFF9900,WWW,INDOOR,5 Je veux diviser le fichier en fichiers plus petits d’environ deux lignes chacun, mais je ne veux pas séparer les lignes avec les mêmes valeurs dans la première colonne. Ici, je me retrouverais avec trois fichiers: x00000: AABB1122,ABC,BLAH,4 […]

Diviser les fichiers sous Linux en fonction des modèles

Besoin d’une astuce Linux rapide. J’ai un fichier alors qu’il aura des lots avec plusieurs enregistrements. Comme 123 HDR 098 LLK blah blah blah 456 HDR 098 LLK blah blah blah 789 HDR 098 LLK blah blah blah J’ai besoin de cela pour être divisé en plusieurs fichiers de “HDR” (inclus) au prochain HDR (non […]

moyen le plus rapide de fractionner des fichiers par groupe unique

Quel est le moyen le plus rapide de diviser un très gros fichier et de l’écrire sur le disque. Par exemple si j’ai des données comme chr a_val b_val a_idx 2 1355 25d abd 2 1785 25d abd 2 1825 36g ahj 3 1125 25d abd 3 1568 25d aky 3 2398 g67 abd 3 […]

fractionner un fichier en fonction d’un motif

J’ai un fichier qui aurait le modèle ci-dessous HDR1|20160101|1234| N1|ABC| XXX|21431415|3522352352|ITEM| FORE|20140508|20140214| SD|0|0039 – data|data|data|data| SD|0|0211 – data|data|data|data| SD|0|0039 – data|data|data|data| SD|0|0211 – data|data|data|data| FORE|20140508|20140214| SD|0|0039 – data|data|data|data| SD|0|0039 – data|data|data|data| SD|0|0211 – data|data|data|data| Je voudrais diviser le fichier en fonction de sa taille mais aussi de prendre en compte les éléments ci-dessous. Les 3 […]

Comment diviser un fichier texte sur un délimiteur en plusieurs fichiers sous Unix?

J’ai un fichier texte qui ressemble à ceci: fichier_entrée 1|abc 2|def 3|ghi n|etc… Je dois diviser cela en deux fichiers sur le séparateur de tubes. Donc, c’est le résultat attendu: Fichier_1: 1 2 3 n Fichier_2: abc def ghi etc Je ne sais pas combien de lignes le fichier d’entrée aura. Comment obtenez-vous cela dans […]