Advertisement
Aceofspades25

Another HERV-K ERV common to Human and Chimp

Feb 18th, 2015
272
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 9.87 KB | None | 0 0
  1. A HERV-K integration that originated in the common ancestor to Human and Chimpanzee
  2.  
  3. GAATGA <- TSR (part of the original sequence that was duplicated upon insertion)
  4.  
  5. TGAAGGGGTGGGTTGCCCCTCCACACCTGTGGGTGTTTCTCATTAGGTGGAATGA <- 3' LTR
  6. CAGACTTGGAAAAGAAAAAAGACACAGAGACAAAGTATAGAGAAAGAAATAAGGGGGCCC
  7. AGGGGACCAGCATTCAGCATACGGAGGATCCCACCAGCCTCTGAGTTCCCTTAGTATTTA
  8. TTGATCATTCTTGGGTGTTTCTCAGAGAGGGGGATGTGGCAGGGTCATAGGATAATAATG
  9. GAGAGAAGGTCAGCAGATAAACACGTGAACAAAGGTCTCTGCATCATAGACAAGGTAAAG
  10. AATTAAGTGCTGTGCTTTAGATATGCATACACATAAACATCTCAATGCCTTACAGAGCAG
  11. TATTGTTGCCCACATGTCCCACCTCCAGCCCTAAGGCGGTTTTCCCCTATCTCAGTAGAT
  12. GGAACATACAATCGGGTTTTATACCGAGACATTCCATTGCCCAGGGATGGGCAGGAGACA
  13. GATGCCTTCCTCTTGTCTCAACTGCAAAGAGGCATGCCTTCCTCTTATACTAATCCTCCT
  14. CAGCACAGACCCTTTATGGGTGTTGGGCTGGGGGACGGTCAGGTCTTTCCCTTCCCACGA
  15. GGCCATATTTCAGACTATCACATGGGGAGAAACCTTGGACAATACCTGGCTTTCCTAGGC
  16. AGAGGTCCCTGTGGCCTTCCGCAGTGTTTGTGTCCCTGGGTAGTTGAGATTAGGGCGTGG
  17. TGATGACTCTAAAGGAGCATGCTGCCTTCAAGCATCTGTTTAACAAAGCACATCCTGCAC
  18. AGCCCTTAATCCATTTAACCCTGAGTTGACACAGCATGTGTTTCAGAGAGCACGGGGTTG
  19. GGGTAAGGTTACAGATTAACAGCATCTCAAAGCAGAAGAATTTTTCTTAATACAGAACAA
  20. AATGGAGTCTCCTGTGTCTACTTCTTTCTATGCAGACACAGTAACAATCTGATCTGTCTT
  21. TCTTTTCCCCACAT
  22.  
  23. TTTCCCCCTTTTCTTTTCGACAAAACAGCCATCGTCATCATGGCCCGTTCTCAATGGTCAC <- Protein coding sequences start here
  24. TGTCTCTTCAGAGCTGTTGGGTACACCTGCAGACTAACAACAGACAAAACAGGCACACAA
  25. GGATTAATATGAAATTTATAATCATAGTACTTCCGATGGTCTTAACCCAAGTGACAGGGT
  26. TAAGATTTGCGAGGCCATCAGCAACTCCTGCGATTGCCTCAGTTCCTGGCACCAAATTTA
  27. AATGGGCTTTTGATGTTTCAAAAATTTGTTCTTTTAATTTGGAAATGTCTAAAGTGAGAT
  28. TATCTTCTCTTCCCTGTAGATGGCGTCTAACCATGTCCCAGTGATGCTCAGACTCATTAT
  29. AAACTTGGGGTGTAATACAAAAATCTGACGTATTCCAGTCACACTGTAACTGGAAACGAT
  30. GTTCTAAGCTCATGAGCCTGTCTCCCATCCAAATGACAGCTTGTCTAAGAACATTAATTT
  31. GATTTGCCATTTTTTGATCAATACCAGATTGCGAATTCCACAATCTCGTAGAATTCTTTT
  32. GCCAATCATTAACAAAGTTTACTGACTGAACAGAAGAGTGCAACGCAACTCCTGCTATAG
  33. CAGCCATAGCTGTGACTGCAATTAATCCCATAATCACTGTAATTAAAGTAAAAATGAATC
  34. TTTTGGATCTATTTAAAATGCCTTTTAATACTTCAGTCAAAACATGGACGGATGGCGAGG
  35. CCTCCCACGGTTGGTCCATGGACACAGGGATCCGCATGCCTTCTCTTGCTCTCACCAGCA
  36. GAATACGGTGCTGCCAAATAAAAGTTGAATCAATGCAAGTAAACAATCTGCAATTTTCAC
  37. AGGTTATAGTTTGGGAGTCTGGTTTAATAACTATATTTCCTACAACTAGCATATAAGGGG
  38. TCTTTACGCAACTTTGTAAAGGAACCGTTAGACTGGAATTTAGGTCGATAGTATAAAATG
  39. GCTTACAATCCCTTGTTTCTAAAGTTTGATTTCCAGACCAAATTCTAATGTGGTATGAGG
  40. CTAAGTAAGCCTCCATAATTCTCAATGTTCAGGACCAGAAACAGGACTTCTTATTTTTGG
  41. TCTTGGGGTAGAGATTCCTTTTTCTCCCCATTCCCAAGGATAGAAAGACTATAATTTTTT
  42. ATGCTTATGTTTGTCTAAACTTTCTGTTAAGTCGCTATCAACAGCTGGACTCACTTGTGC
  43. ACTGGGACACGACTGAGTTTGCCCTGTGCAATCATGGTAGAATTGACCCAAGGTGCCCAA
  44. TCTATAATAGTTCCAAATTCATTGTTTTGTAATATCACCGCACTATTGGCCACACATTCT
  45. TCCCAAACTAAAACTTCTGTATTTTTTGATCCTTTGGGAATTTCCTTGGGGCAAGGTTTC
  46. CCTTTAGGTCTAAACTTTAATGATCTTTGATAAGAAAAGTCTTGTAAATAATTTACCCGT
  47. GGCCTGAGTGACATCCCACTTACCATGTAAGAAATGATTCTACTGATGGGACTGACAGTA
  48. GGTCCTTCTACCAACCAATTTTGGACTGCAGGCATTAAGCATCCTGGTGCTCTCCCTAGG
  49. CAAATAGGAGGATAACGATACCCAGTGGAAATATTTATCATCATCACTTCTTCCTCAGGT
  50. TTGGCAGGGCAGCGATCATCTGTGGGGCCAGGTACGCATACACTCTCATTAACATATACT
  51. TCTATAGGATTATCCATCCATGTGACTGCCCAAATTAAGGGCGGGAAAGGCACATATGCC
  52. CAGTAGGTATAATTAGCTGCAGCTGCTCCTGCAGGCATAGGGAGACTTACCACCGTTGAT
  53. ACAATCATCAATGCTGCAAGCAGCATACTCTCTGGAGTTTGTGTCATCTTTGTGTTCTCT
  54. AGACATTTTGTAGCTAACTGCGTCAGCTTGTTTAGTTGTGCCCAAGTCAGCGGCTCTGCC
  55. TTATTGGTGGATGGCAACTTCATCTGTTCTTCTGACATCATCATTTTGTTCATCTTGTGA
  56. CTCGACGGTGCTCGATTGCGGTGTCTCCGTCTCCGCGGAGGTGCTTTTCTTTGCATCTCC
  57. GATGGGTTCATTGTAGAACTTCAAATGTCTAGTGGGTATCCAAACAGGAAGCTGATTTTC
  58. TCCTGGTGAAACACAAGCAAAACCTCTTCCCCACGTTATCACCTTCCCTATTTCCCATGT
  59. CTTATTTTTATTATCTTTCCACCAAATCAATTTTCCTTCATGTGGGCTGTTCTTTTTACC
  60. AGTAAGATGTTGTTCTGCAGAAGTAGTAGTCTGATTTCTATAAATGTTTAAAAAATTTAA
  61. AGTATAGAGTGCTAGATTAAGTTGCATCTGAGGAGTGGTACACTCTTTACTGTCTCCCCC
  62. TTCTTTTTGTTTAACTAATTGAGTTTTGAGTGTTCTATTAGTTCTTTCAACTATGGCCTG
  63. TCCTTGGGAATTATAGGGAATTCCTGTTGTATGTGAAATTTTCCACCGATTTAAGAATCT
  64. TTGGAAAGCTTTACTACAATATCCTGGCCCATTGTCAGTTTTGATTTTTTCTGGAACTCC
  65. CATTACAGCAAAACAAGATAATAAATGTTTTTTAACATGGGAAGTACTTTCTCCTGTTTC
  66. GCAAGCTGCCCATATGAAATGTGAATAAGTATCAACTGTTACATGAACATATGACAATCT
  67. TCCAAATGAAGGTACATGCGTGACATCCATTTGCCATAATGCATTAGGACGCAGACCTCT
  68. GGGATTAACTCCTGCCTCTTGAGTGGGCAGGTGTAAGACTTGACACTGGGTGCAATGTTG
  69. TACAATATCTTTTGCCTGTTTCCATGTGACATCAAATTTGTTTTTTAATCCTGCTGCATT
  70. TACATGAGTCAAAGCATGAAGTTCTCATGCTTTTATGAATGCAGATGATACCAGTAAGTC
  71. AGCTTGTTCATTTGCTTTAGTCAAAGGCCCTGGTAAATTAGTGTGTGCTCGAATATGAGT
  72. AATATAAAATGGGAAATTTCTTTTTCTTACAGTTTGTTGTAATAAATTGAATAGCTGGTT
  73. TAACTGATCATCCATGCTATATTTGATTAGAGCTGTCTCAACATCCCTTGTAGCCTGTAC
  74. TACATATGCAGAATCTGATACAATATTGATAGGTTGATCAAAATCTTGTAACACTGTAAT
  75. GACTGCAACCAACTCTGCTCTTTGAGCCGATTGATATGGAGTTTTGATTACTCATTCTTT
  76. CGGCCCTGTGTAAGCCACTTTTCCATTGCTGGAACCATCAGTAAATACTGTTAGAACATT
  77. TTCTAAAAGTTCCCATCTGGTAATTTTAGGTAGAATCCAAGTAGTCAGTTTTAAAAACTG
  78. GAAGATTTTTGTTTTCGGGTAATGATTATCAATAATTCCCACAAAATTAGCAAGACCAAT
  79. CTGCCATGCACCAGAATTGATAAAGGCTTGTCTAATTTGTTCCTTGGTTAAAGGGACAAC
  80. TATTTTGTCTGGGTCATTTCCACATAATTTTATTATTCATAATCTTGTCTGACCAATTAA
  81. TGTGGCTATTTGATCCAAGTACAATGTAAAAGTCTTAACTGTACTGTGAGGAAGGAATGA
  82. CCACTCCACAAGATCAGTATTTTGAATAATGATGCCTGTTGGAGAATGTGCAGTAGCAAA
  83. AATCAAAAGTTGGAGTGGGGCTAAGGGATCTGTTCTATTTATTTGCGCTGACTGAATTTT
  84. TTCTTCCACTAATTTAATTTCTTTTGTTGCCTCTGGGGTTAACATTCTCTTACTATTTAA
  85. GTCTGAGTCTCCTCTTAAGATAGAGAACAAATTTGACATGGCATAAGTAGGAATGCCTAG
  86. AGTTGGCCGAATCCAATTAATATCTCCCAGCAATTTTTGAAAATCATTTAGTGTTTTTAA
  87. TGTGTCTTTTCTTATTTCTATTTTTTGTGGCTTAATTTTTCTATTCTCTATCTGCATCCC
  88. TAAATAATGAAAAGGAGTAGAGGTTTGAGTCTTATCAGATGCTATTGCCAGTCCTGCGTT
  89. GGCAACCTCTGCTTGCAGAAATGTATAAGTCAATTAATTTATCTCTTGTTTCTGCAGCAC
  90. ACAAAATATCATCAATATAATGAATAACAGTCTGAAAACTTGTCTCTAACTGGTTAAAGA
  91. GCACGACCTACAAAAGTCTGACAAATAGTTGGACTATTAAGCATTCCCTGAGGTAACACT
  92. TTCCACTGAAACCTGGTGGCTGGTTCTTTATTATTTATGGCTGGTATAGTAAAGGCAAAT
  93. TTTTCGCAATCCTGCTCCGCCAGAGGGATGGTAAAAAAGCAGTCCTTTAGATCAATTATA
  94. ATTAAAGGCCAGTCTTTGGGATCATGGCCAGAGAGGGCAATCCGGGTTGGAGAGGCCCCA
  95. TGGGTTGATTTACGGCATTTACGGCCCTTAAGTCAGTTAACATACACCATTTGCTGGATT
  96. TCTTCTGAATTACAAACACAGGAGAATTCCAAGGCGAGAATGAAGGCTCAATATGTCCCT
  97. TTTTGAACTGTTCATTTGCTAATGAATGTAAAGCCTCCAGTTTTTGTTTTGGTAGCGGCC
  98. ACTGATTTACCCATACTGGTTTTTCTGTTTTCCAAGTTAATGGTATGGGTTTAGGAGGCT
  99. CTACAGTGGCCGCCCCTAACAAGGATACCCTAATTCCTTCTCTTTCTTGATTTATTTTAG
  100. CCTCAACTGGAACTTTAATGCCATCTTCATTTTTTCCTAGTCCCTTTCCTGGTATATATC
  101. CCATCTTGGTCATGATTTTTTGACTCGTGGGGCTATATAATGGAGCGGGCATGGTGATTT
  102. CCACACCCCATTGTTGTAATAAATCTTGACCCCACAGATTAAGAGGAGTTGAAGTAATCA
  103. TTGGCTGAACAGTACTTTCTTGATTATCTGGCCCTAAACAATGTAAAATCTCAGTACTTT
  104. GATACACTTCTGAGGCTGTGCCTACGCCGACAAGTCCCGTAACAGCCTTTTGTTTAGGCC
  105. AATTTTTTGGCCACTGATTTAAAGCAATGATAGAGACATCTGCCCCAGTGTCTACCAACC
  106. CTTCAAACTGTTTTCCTTGAATAATGGCCTTACACACAGGTCTGTTCTCTGAGATCTGAC
  107. TTGCCCAGTATGCAGCCTTTCCTGTTGGAACAGTGCTTCCAAACCCTCCTGTTCTTTTTA
  108. TCTCACTATTTCCAACCTTAATATAAGGCAGGAGTAAAAATGGAAAAATCCTGTCTCCTG
  109. GAGTGGCACTCCAAGGAATTGAAGAGCTAATAACCAATTGAATTTTGCCTTTATAGTCTG
  110. AATCAACCACACAAGTATGAATTTGAACTCCCTTTAGATTTATACTTGATCTTCCCAAGA
  111. TTAGTCCTACAGTACCCTCAGGCAGCAGGCCATATAACCCTGTGGGGATTTTTTGTGGGG
  112. GCTCCCCTGGAAGCAGAGAGACTGCTTGTATAGTACATAAATCTACTGCTGCACTGCCAC
  113. TTGTGGCGGGGGACAATTGTTGTATTGTGGTAACTGGCTTATTCCCTGAGGTACTTGGGA
  114. CAGTGGGGGTTGTTGTCCCTGAAAACCCTGAGGAACAAAGGGCTGAATTGGGAATGCCCC
  115. AGTTTGTTGTGGGGCCTGAGGCTGGCCCCTTTGCTCGTTTCCTGACAATGGTTGCCCATT
  116. TCTATCAAATTTAGAATGACATTAACTAGCCCAATGTTTTCCTTTTTTACATCTTGGACA
  117. TAAGTCTGGTGGCTCTCTACCTGTTGTTGTAGTCGCTTGAATAGTTATATTCTGTTTATT
  118. TGAGACTGGGCAATTCTTTTTTAAATGACCAATTTGACCACAATTATAACATTTCCCTCC
  119. AAATGTTCTAACTTGTCCTTCTAAAACAACTCCCACTATTGCTTGAGCCATAAGCTTAGC
  120. TTTATGCATAGCTCCTCCAATTCCATCACAGGCTTTTACATACTCTGAGATTACATCTGA
  121. TCCTGTGGAAACCTTTCCTTTTAATGGCTTAATGGCTGATTGACACTCAGGATTGGCGTT
  122. TTCGTATGCCATCAACTCCACTATGACCTTACGGGCTTTTTCATCAGCAATTGACTTTTG
  123. AGCAACATCTTGGAACCTTGCCACAAAATCAGGGTAGGGCTCTTTCAAACCTTGTCTTAC
  124. TGTATGAAATGAGGGGCAGGCGGTTCCTGGGTCTTGGATTTTTTCCCAGGCTCTAAGGCA
  125. GATAGCTCTAACTTGCTCAATGGCCTCATTTTGCATTAATGCTTGTTGACTAATAGTGCT
  126. CCAATTTTGACCTGTTCCTAACAGTTGATCTGCATCTTTGTTAACTGGAGGATTGGCAGC
  127. CCTATTTCTTCAGACCTGTTCTTGTGCCCCATCAATCCACCAAGTCTTAAATTGTAAAAA
  128. TTGAGAGGGTGAGAGAGACGATTTTGCCAGAATCTCCCAATCATAAGGAATGAGTCTATG
  129. ATGTCCATGAGCAATGGAATCTAATAATGTCCTCATATAAGGGGAGTTGGGTCCATAGTG
  130. TTTTACTCCCTCTTTCATATCTTTTAGCATTTTTATCGAAAAAGACTTGTATCTGGCCTC
  131. AACTGTGAGAGGCTCTCCCTCTTGGGCTCCTTCTCCAGGTGGTATCGGTTCTAACGTTAC
  132. TGGGAATTGCCACGCCTCAGTGTCTCCTTCCTTTCTTGACTTATCAATAATTTCATGTAA
  133. TTCACTACCCTGTCTACTAGGTGGTGCCGTATGATTAAGTCTGCTAGTGGGTGGCTGAGG
  134. GTATGGCGCCCTGCCCTGTGGTGCTGGGAGCGTTCCTGGATATCCATACTGACTTTCTGG
  135. GGGTGGCCGATACTGAAGTTTGGCCGGTGGCCAGTATTGATAAGCTACTGGTAGTTGGGT
  136. CTTATTTTCTCTAACCTGCGTTTGAGGTTGTAATGTTACGGGCATCTGACCTACTGGAAG
  137. AGGACTTGGTCCTCGTGGTTTAGACTTTGATGGCCCCACTAATTCTGGACCTTTTCCTTC
  138. TAATTTTAATGTTTCAGGATATATCACCCCCTGTAATTGATTGATTATAGTCAACATTTT
  139. GCGTTGACTGAGCCATTACTGGCTCTGCTACATATTCGCAATGTAAACTTTCCGTTTCTT
  140. TCTGGGATTTTTTCCCTGTCTTGTCTTTACAATCTATTACACAGCTTCCAGGGGCATCAG
  141. AAACTGAAACACTATCTTCTTCTCTTTGAAATCGTTCTAAAGCTGCTTTAATAATGGCCC
  142. AATCATTCCATACTGTAAGTGGAATGATATTACCCTTCCTACCTGCTTTAGTTCCTTGCC
  143. AATTCTTTTCCAGTCTTCTTTTAGATCTAAAGTTCCTTGTTCTGGAAACCATGGGCAAAA
  144. TTGTTCTATTGTTTGAAATAGCTTGATTAGATTTTTTGTAGATACTCTAACTCCCACTCT
  145. TTTTAAAAGAATTTTAATAAAGCTGAGATAAAAGGCATATTTATTTTTAGTTTTCCTTTA
  146. ATTTGCCCCATTGTCACCCTAGCTTCGTCCGAGCGCACTGTAAGGCTGACTGTAGACGTA
  147. CTCGGGATCTCTCGTCGACTTGTCCTCAATGACCATGCTCGAGCGTACCTTCACCCTAGA
  148. GAAAAGCCCCCACATTGGGCACCAGA
  149.  
  150. GAAGGGGTGGGTTGCCCCTCCACACCTGTGGGTGTTTCTTGTTAGGTAGAACAAGAGACT <- 5' LTR
  151. TGGAAAAGAAAAAGACACAGAGACAAAGTATAGAGAAAGGAATAAGGGGGCCCAGAGGAC
  152. CAGCATTCAGCATACGGAGGATCCCGCCAGCCTCTGAGTTCCCTTAGTATTTATTGATCA
  153. TTTTTGGGTGTTTCTCAGAGAGGGGGATGTGGCAGGGTCATAGGATAATAGTGGAGAGAA
  154. GGTCAGCAGATAAACAGGTGAACAAAGGTCTCTGCATCATAGACAAGGTAAAGAATTAAG
  155. TGCTGTGCTTTAGATATGCATACACATAAACATCTCAATGCCTTACAGAGCAGTATTGTT
  156. GCCCACATGTCCCACCTCCAGCCCTAAGGCGGTTTTCCCCTATCTCAGTAGATGGAACAT
  157. ACAATTGGGTTTTATACCGAGACATTCCATTGCCCAGGGACAGGCAGGAGACAGATGCCT
  158. TCCTCTTGTCTCAACTGCAAAGAGGCATGCCTTCCTCTTATACTAATCCTCCTCAGCACA
  159. GACCCTTTACGGGTGTCGAGCTGCGGGACGGTCAGGTCTTTCCCTTCCCACGAGGCCATA
  160. TTTCAGACTATCACATGGGGAGAAACCTTGGACAATACCTGGCTTTCCTAGGCAGAGGTC
  161. CCTGTGGCCTTCTGCAGTGTTTGTATCCCTGGGTAGTTGAGATTAGGGCGTGGTGATGAC
  162. TCTTAAGGAGCATGCTGCCTTCAAGCATCTGTTTAACAAAGCACATCCTGCACAGCCCTT
  163. AATCCATTTAACCCTGAGTTGACACAGCATGTGTTTCAGAGAGCCTGGGGTTGGGGGTAA
  164. GGTTATAGATTAACAGCATCTCAAGGCAGAAGAATTTTTCTTAATACAGAACAAAATGGA
  165. GTCTCCTATGTCTGCTTCTTTCTATACAGACACAGTAACAATCTGATCTCTCTTTCTTTT
  166. CCCCACA
  167.  
  168. GAATGA <- TSR (part of the original sequence that was duplicated upon insertion)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement