Cum se convertește un fișier TXT în FASTA

Pasul 1

Deschideți fișierul text cu secvența de proteine ​​pe care doriți să o modificați într-un program de editare a textului, cum ar fi Notepad.

Pasul 2

Editați sau adăugați linia de descriere pentru a urma formatul FASTA. De exemplu, > gi | 129295 | sp | P01013 | OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED) este o linie de descriere FASTA valabilă. Această linie oferă o descriere unică pentru secvența de date care urmează. Formatul FASTA necesită utilizarea simbolului mai mare decât (>), astfel încât programul să poată identifica informațiile descriptive unice și să evite prelucrarea descrierii ca linie de date de secvență de proteine.

Pasul 3

Apăsați "Enter" pentru a insera o rupere de linie odată ce ați editat linia de descriere.

Pasul 4

Modificați sau adăugați formatul liniei de date privind secvențele de proteine ​​pentru a se conforma codurilor standard IUB / IUPAC. Standardul IUB / IUPAC utilizează literele din alfabet pentru a reprezenta codurile acceptabile sau secvențele de interogare pentru aminoacizi sau acizi nucleici în formatul FASTA. De exemplu, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE reprezintă o linie validă de secvență de date, deoarece începe cu litera "Q", reprezentând glutamina și se termină cu litera "E", care reprezintă glutamatul.

Pasul 5

Adăugați mai multe linii de secvențe de date, editați cele existente sau adăugați pauze de linie după 80 de caractere, după cum este necesar. Adăugarea de standarde de linii și de rupturi de linii în fluxul de date FASTA asigură că programul respectă instrucțiunile referitoare la codurile de glutamină, glutamat și alte litere. Literele din standardul IUB / IUPAC sunt pur și simplu instrucțiuni pentru programul care procesează datele în format FASTA.

Pasul 6

Faceți clic pe "Fișier", selectați și faceți clic pe butonul "Salvați". Fișierul dvs. TXT este deja în format FASTA.