Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- A HERV-K integration that originated in the common ancestor to Human and Chimpanzee
- GAATGA <- TSR (part of the original sequence that was duplicated upon insertion)
- TGAAGGGGTGGGTTGCCCCTCCACACCTGTGGGTGTTTCTCATTAGGTGGAATGA <- 3' LTR
- CAGACTTGGAAAAGAAAAAAGACACAGAGACAAAGTATAGAGAAAGAAATAAGGGGGCCC
- AGGGGACCAGCATTCAGCATACGGAGGATCCCACCAGCCTCTGAGTTCCCTTAGTATTTA
- TTGATCATTCTTGGGTGTTTCTCAGAGAGGGGGATGTGGCAGGGTCATAGGATAATAATG
- GAGAGAAGGTCAGCAGATAAACACGTGAACAAAGGTCTCTGCATCATAGACAAGGTAAAG
- AATTAAGTGCTGTGCTTTAGATATGCATACACATAAACATCTCAATGCCTTACAGAGCAG
- TATTGTTGCCCACATGTCCCACCTCCAGCCCTAAGGCGGTTTTCCCCTATCTCAGTAGAT
- GGAACATACAATCGGGTTTTATACCGAGACATTCCATTGCCCAGGGATGGGCAGGAGACA
- GATGCCTTCCTCTTGTCTCAACTGCAAAGAGGCATGCCTTCCTCTTATACTAATCCTCCT
- CAGCACAGACCCTTTATGGGTGTTGGGCTGGGGGACGGTCAGGTCTTTCCCTTCCCACGA
- GGCCATATTTCAGACTATCACATGGGGAGAAACCTTGGACAATACCTGGCTTTCCTAGGC
- AGAGGTCCCTGTGGCCTTCCGCAGTGTTTGTGTCCCTGGGTAGTTGAGATTAGGGCGTGG
- TGATGACTCTAAAGGAGCATGCTGCCTTCAAGCATCTGTTTAACAAAGCACATCCTGCAC
- AGCCCTTAATCCATTTAACCCTGAGTTGACACAGCATGTGTTTCAGAGAGCACGGGGTTG
- GGGTAAGGTTACAGATTAACAGCATCTCAAAGCAGAAGAATTTTTCTTAATACAGAACAA
- AATGGAGTCTCCTGTGTCTACTTCTTTCTATGCAGACACAGTAACAATCTGATCTGTCTT
- TCTTTTCCCCACAT
- TTTCCCCCTTTTCTTTTCGACAAAACAGCCATCGTCATCATGGCCCGTTCTCAATGGTCAC <- Protein coding sequences start here
- TGTCTCTTCAGAGCTGTTGGGTACACCTGCAGACTAACAACAGACAAAACAGGCACACAA
- GGATTAATATGAAATTTATAATCATAGTACTTCCGATGGTCTTAACCCAAGTGACAGGGT
- TAAGATTTGCGAGGCCATCAGCAACTCCTGCGATTGCCTCAGTTCCTGGCACCAAATTTA
- AATGGGCTTTTGATGTTTCAAAAATTTGTTCTTTTAATTTGGAAATGTCTAAAGTGAGAT
- TATCTTCTCTTCCCTGTAGATGGCGTCTAACCATGTCCCAGTGATGCTCAGACTCATTAT
- AAACTTGGGGTGTAATACAAAAATCTGACGTATTCCAGTCACACTGTAACTGGAAACGAT
- GTTCTAAGCTCATGAGCCTGTCTCCCATCCAAATGACAGCTTGTCTAAGAACATTAATTT
- GATTTGCCATTTTTTGATCAATACCAGATTGCGAATTCCACAATCTCGTAGAATTCTTTT
- GCCAATCATTAACAAAGTTTACTGACTGAACAGAAGAGTGCAACGCAACTCCTGCTATAG
- CAGCCATAGCTGTGACTGCAATTAATCCCATAATCACTGTAATTAAAGTAAAAATGAATC
- TTTTGGATCTATTTAAAATGCCTTTTAATACTTCAGTCAAAACATGGACGGATGGCGAGG
- CCTCCCACGGTTGGTCCATGGACACAGGGATCCGCATGCCTTCTCTTGCTCTCACCAGCA
- GAATACGGTGCTGCCAAATAAAAGTTGAATCAATGCAAGTAAACAATCTGCAATTTTCAC
- AGGTTATAGTTTGGGAGTCTGGTTTAATAACTATATTTCCTACAACTAGCATATAAGGGG
- TCTTTACGCAACTTTGTAAAGGAACCGTTAGACTGGAATTTAGGTCGATAGTATAAAATG
- GCTTACAATCCCTTGTTTCTAAAGTTTGATTTCCAGACCAAATTCTAATGTGGTATGAGG
- CTAAGTAAGCCTCCATAATTCTCAATGTTCAGGACCAGAAACAGGACTTCTTATTTTTGG
- TCTTGGGGTAGAGATTCCTTTTTCTCCCCATTCCCAAGGATAGAAAGACTATAATTTTTT
- ATGCTTATGTTTGTCTAAACTTTCTGTTAAGTCGCTATCAACAGCTGGACTCACTTGTGC
- ACTGGGACACGACTGAGTTTGCCCTGTGCAATCATGGTAGAATTGACCCAAGGTGCCCAA
- TCTATAATAGTTCCAAATTCATTGTTTTGTAATATCACCGCACTATTGGCCACACATTCT
- TCCCAAACTAAAACTTCTGTATTTTTTGATCCTTTGGGAATTTCCTTGGGGCAAGGTTTC
- CCTTTAGGTCTAAACTTTAATGATCTTTGATAAGAAAAGTCTTGTAAATAATTTACCCGT
- GGCCTGAGTGACATCCCACTTACCATGTAAGAAATGATTCTACTGATGGGACTGACAGTA
- GGTCCTTCTACCAACCAATTTTGGACTGCAGGCATTAAGCATCCTGGTGCTCTCCCTAGG
- CAAATAGGAGGATAACGATACCCAGTGGAAATATTTATCATCATCACTTCTTCCTCAGGT
- TTGGCAGGGCAGCGATCATCTGTGGGGCCAGGTACGCATACACTCTCATTAACATATACT
- TCTATAGGATTATCCATCCATGTGACTGCCCAAATTAAGGGCGGGAAAGGCACATATGCC
- CAGTAGGTATAATTAGCTGCAGCTGCTCCTGCAGGCATAGGGAGACTTACCACCGTTGAT
- ACAATCATCAATGCTGCAAGCAGCATACTCTCTGGAGTTTGTGTCATCTTTGTGTTCTCT
- AGACATTTTGTAGCTAACTGCGTCAGCTTGTTTAGTTGTGCCCAAGTCAGCGGCTCTGCC
- TTATTGGTGGATGGCAACTTCATCTGTTCTTCTGACATCATCATTTTGTTCATCTTGTGA
- CTCGACGGTGCTCGATTGCGGTGTCTCCGTCTCCGCGGAGGTGCTTTTCTTTGCATCTCC
- GATGGGTTCATTGTAGAACTTCAAATGTCTAGTGGGTATCCAAACAGGAAGCTGATTTTC
- TCCTGGTGAAACACAAGCAAAACCTCTTCCCCACGTTATCACCTTCCCTATTTCCCATGT
- CTTATTTTTATTATCTTTCCACCAAATCAATTTTCCTTCATGTGGGCTGTTCTTTTTACC
- AGTAAGATGTTGTTCTGCAGAAGTAGTAGTCTGATTTCTATAAATGTTTAAAAAATTTAA
- AGTATAGAGTGCTAGATTAAGTTGCATCTGAGGAGTGGTACACTCTTTACTGTCTCCCCC
- TTCTTTTTGTTTAACTAATTGAGTTTTGAGTGTTCTATTAGTTCTTTCAACTATGGCCTG
- TCCTTGGGAATTATAGGGAATTCCTGTTGTATGTGAAATTTTCCACCGATTTAAGAATCT
- TTGGAAAGCTTTACTACAATATCCTGGCCCATTGTCAGTTTTGATTTTTTCTGGAACTCC
- CATTACAGCAAAACAAGATAATAAATGTTTTTTAACATGGGAAGTACTTTCTCCTGTTTC
- GCAAGCTGCCCATATGAAATGTGAATAAGTATCAACTGTTACATGAACATATGACAATCT
- TCCAAATGAAGGTACATGCGTGACATCCATTTGCCATAATGCATTAGGACGCAGACCTCT
- GGGATTAACTCCTGCCTCTTGAGTGGGCAGGTGTAAGACTTGACACTGGGTGCAATGTTG
- TACAATATCTTTTGCCTGTTTCCATGTGACATCAAATTTGTTTTTTAATCCTGCTGCATT
- TACATGAGTCAAAGCATGAAGTTCTCATGCTTTTATGAATGCAGATGATACCAGTAAGTC
- AGCTTGTTCATTTGCTTTAGTCAAAGGCCCTGGTAAATTAGTGTGTGCTCGAATATGAGT
- AATATAAAATGGGAAATTTCTTTTTCTTACAGTTTGTTGTAATAAATTGAATAGCTGGTT
- TAACTGATCATCCATGCTATATTTGATTAGAGCTGTCTCAACATCCCTTGTAGCCTGTAC
- TACATATGCAGAATCTGATACAATATTGATAGGTTGATCAAAATCTTGTAACACTGTAAT
- GACTGCAACCAACTCTGCTCTTTGAGCCGATTGATATGGAGTTTTGATTACTCATTCTTT
- CGGCCCTGTGTAAGCCACTTTTCCATTGCTGGAACCATCAGTAAATACTGTTAGAACATT
- TTCTAAAAGTTCCCATCTGGTAATTTTAGGTAGAATCCAAGTAGTCAGTTTTAAAAACTG
- GAAGATTTTTGTTTTCGGGTAATGATTATCAATAATTCCCACAAAATTAGCAAGACCAAT
- CTGCCATGCACCAGAATTGATAAAGGCTTGTCTAATTTGTTCCTTGGTTAAAGGGACAAC
- TATTTTGTCTGGGTCATTTCCACATAATTTTATTATTCATAATCTTGTCTGACCAATTAA
- TGTGGCTATTTGATCCAAGTACAATGTAAAAGTCTTAACTGTACTGTGAGGAAGGAATGA
- CCACTCCACAAGATCAGTATTTTGAATAATGATGCCTGTTGGAGAATGTGCAGTAGCAAA
- AATCAAAAGTTGGAGTGGGGCTAAGGGATCTGTTCTATTTATTTGCGCTGACTGAATTTT
- TTCTTCCACTAATTTAATTTCTTTTGTTGCCTCTGGGGTTAACATTCTCTTACTATTTAA
- GTCTGAGTCTCCTCTTAAGATAGAGAACAAATTTGACATGGCATAAGTAGGAATGCCTAG
- AGTTGGCCGAATCCAATTAATATCTCCCAGCAATTTTTGAAAATCATTTAGTGTTTTTAA
- TGTGTCTTTTCTTATTTCTATTTTTTGTGGCTTAATTTTTCTATTCTCTATCTGCATCCC
- TAAATAATGAAAAGGAGTAGAGGTTTGAGTCTTATCAGATGCTATTGCCAGTCCTGCGTT
- GGCAACCTCTGCTTGCAGAAATGTATAAGTCAATTAATTTATCTCTTGTTTCTGCAGCAC
- ACAAAATATCATCAATATAATGAATAACAGTCTGAAAACTTGTCTCTAACTGGTTAAAGA
- GCACGACCTACAAAAGTCTGACAAATAGTTGGACTATTAAGCATTCCCTGAGGTAACACT
- TTCCACTGAAACCTGGTGGCTGGTTCTTTATTATTTATGGCTGGTATAGTAAAGGCAAAT
- TTTTCGCAATCCTGCTCCGCCAGAGGGATGGTAAAAAAGCAGTCCTTTAGATCAATTATA
- ATTAAAGGCCAGTCTTTGGGATCATGGCCAGAGAGGGCAATCCGGGTTGGAGAGGCCCCA
- TGGGTTGATTTACGGCATTTACGGCCCTTAAGTCAGTTAACATACACCATTTGCTGGATT
- TCTTCTGAATTACAAACACAGGAGAATTCCAAGGCGAGAATGAAGGCTCAATATGTCCCT
- TTTTGAACTGTTCATTTGCTAATGAATGTAAAGCCTCCAGTTTTTGTTTTGGTAGCGGCC
- ACTGATTTACCCATACTGGTTTTTCTGTTTTCCAAGTTAATGGTATGGGTTTAGGAGGCT
- CTACAGTGGCCGCCCCTAACAAGGATACCCTAATTCCTTCTCTTTCTTGATTTATTTTAG
- CCTCAACTGGAACTTTAATGCCATCTTCATTTTTTCCTAGTCCCTTTCCTGGTATATATC
- CCATCTTGGTCATGATTTTTTGACTCGTGGGGCTATATAATGGAGCGGGCATGGTGATTT
- CCACACCCCATTGTTGTAATAAATCTTGACCCCACAGATTAAGAGGAGTTGAAGTAATCA
- TTGGCTGAACAGTACTTTCTTGATTATCTGGCCCTAAACAATGTAAAATCTCAGTACTTT
- GATACACTTCTGAGGCTGTGCCTACGCCGACAAGTCCCGTAACAGCCTTTTGTTTAGGCC
- AATTTTTTGGCCACTGATTTAAAGCAATGATAGAGACATCTGCCCCAGTGTCTACCAACC
- CTTCAAACTGTTTTCCTTGAATAATGGCCTTACACACAGGTCTGTTCTCTGAGATCTGAC
- TTGCCCAGTATGCAGCCTTTCCTGTTGGAACAGTGCTTCCAAACCCTCCTGTTCTTTTTA
- TCTCACTATTTCCAACCTTAATATAAGGCAGGAGTAAAAATGGAAAAATCCTGTCTCCTG
- GAGTGGCACTCCAAGGAATTGAAGAGCTAATAACCAATTGAATTTTGCCTTTATAGTCTG
- AATCAACCACACAAGTATGAATTTGAACTCCCTTTAGATTTATACTTGATCTTCCCAAGA
- TTAGTCCTACAGTACCCTCAGGCAGCAGGCCATATAACCCTGTGGGGATTTTTTGTGGGG
- GCTCCCCTGGAAGCAGAGAGACTGCTTGTATAGTACATAAATCTACTGCTGCACTGCCAC
- TTGTGGCGGGGGACAATTGTTGTATTGTGGTAACTGGCTTATTCCCTGAGGTACTTGGGA
- CAGTGGGGGTTGTTGTCCCTGAAAACCCTGAGGAACAAAGGGCTGAATTGGGAATGCCCC
- AGTTTGTTGTGGGGCCTGAGGCTGGCCCCTTTGCTCGTTTCCTGACAATGGTTGCCCATT
- TCTATCAAATTTAGAATGACATTAACTAGCCCAATGTTTTCCTTTTTTACATCTTGGACA
- TAAGTCTGGTGGCTCTCTACCTGTTGTTGTAGTCGCTTGAATAGTTATATTCTGTTTATT
- TGAGACTGGGCAATTCTTTTTTAAATGACCAATTTGACCACAATTATAACATTTCCCTCC
- AAATGTTCTAACTTGTCCTTCTAAAACAACTCCCACTATTGCTTGAGCCATAAGCTTAGC
- TTTATGCATAGCTCCTCCAATTCCATCACAGGCTTTTACATACTCTGAGATTACATCTGA
- TCCTGTGGAAACCTTTCCTTTTAATGGCTTAATGGCTGATTGACACTCAGGATTGGCGTT
- TTCGTATGCCATCAACTCCACTATGACCTTACGGGCTTTTTCATCAGCAATTGACTTTTG
- AGCAACATCTTGGAACCTTGCCACAAAATCAGGGTAGGGCTCTTTCAAACCTTGTCTTAC
- TGTATGAAATGAGGGGCAGGCGGTTCCTGGGTCTTGGATTTTTTCCCAGGCTCTAAGGCA
- GATAGCTCTAACTTGCTCAATGGCCTCATTTTGCATTAATGCTTGTTGACTAATAGTGCT
- CCAATTTTGACCTGTTCCTAACAGTTGATCTGCATCTTTGTTAACTGGAGGATTGGCAGC
- CCTATTTCTTCAGACCTGTTCTTGTGCCCCATCAATCCACCAAGTCTTAAATTGTAAAAA
- TTGAGAGGGTGAGAGAGACGATTTTGCCAGAATCTCCCAATCATAAGGAATGAGTCTATG
- ATGTCCATGAGCAATGGAATCTAATAATGTCCTCATATAAGGGGAGTTGGGTCCATAGTG
- TTTTACTCCCTCTTTCATATCTTTTAGCATTTTTATCGAAAAAGACTTGTATCTGGCCTC
- AACTGTGAGAGGCTCTCCCTCTTGGGCTCCTTCTCCAGGTGGTATCGGTTCTAACGTTAC
- TGGGAATTGCCACGCCTCAGTGTCTCCTTCCTTTCTTGACTTATCAATAATTTCATGTAA
- TTCACTACCCTGTCTACTAGGTGGTGCCGTATGATTAAGTCTGCTAGTGGGTGGCTGAGG
- GTATGGCGCCCTGCCCTGTGGTGCTGGGAGCGTTCCTGGATATCCATACTGACTTTCTGG
- GGGTGGCCGATACTGAAGTTTGGCCGGTGGCCAGTATTGATAAGCTACTGGTAGTTGGGT
- CTTATTTTCTCTAACCTGCGTTTGAGGTTGTAATGTTACGGGCATCTGACCTACTGGAAG
- AGGACTTGGTCCTCGTGGTTTAGACTTTGATGGCCCCACTAATTCTGGACCTTTTCCTTC
- TAATTTTAATGTTTCAGGATATATCACCCCCTGTAATTGATTGATTATAGTCAACATTTT
- GCGTTGACTGAGCCATTACTGGCTCTGCTACATATTCGCAATGTAAACTTTCCGTTTCTT
- TCTGGGATTTTTTCCCTGTCTTGTCTTTACAATCTATTACACAGCTTCCAGGGGCATCAG
- AAACTGAAACACTATCTTCTTCTCTTTGAAATCGTTCTAAAGCTGCTTTAATAATGGCCC
- AATCATTCCATACTGTAAGTGGAATGATATTACCCTTCCTACCTGCTTTAGTTCCTTGCC
- AATTCTTTTCCAGTCTTCTTTTAGATCTAAAGTTCCTTGTTCTGGAAACCATGGGCAAAA
- TTGTTCTATTGTTTGAAATAGCTTGATTAGATTTTTTGTAGATACTCTAACTCCCACTCT
- TTTTAAAAGAATTTTAATAAAGCTGAGATAAAAGGCATATTTATTTTTAGTTTTCCTTTA
- ATTTGCCCCATTGTCACCCTAGCTTCGTCCGAGCGCACTGTAAGGCTGACTGTAGACGTA
- CTCGGGATCTCTCGTCGACTTGTCCTCAATGACCATGCTCGAGCGTACCTTCACCCTAGA
- GAAAAGCCCCCACATTGGGCACCAGA
- GAAGGGGTGGGTTGCCCCTCCACACCTGTGGGTGTTTCTTGTTAGGTAGAACAAGAGACT <- 5' LTR
- TGGAAAAGAAAAAGACACAGAGACAAAGTATAGAGAAAGGAATAAGGGGGCCCAGAGGAC
- CAGCATTCAGCATACGGAGGATCCCGCCAGCCTCTGAGTTCCCTTAGTATTTATTGATCA
- TTTTTGGGTGTTTCTCAGAGAGGGGGATGTGGCAGGGTCATAGGATAATAGTGGAGAGAA
- GGTCAGCAGATAAACAGGTGAACAAAGGTCTCTGCATCATAGACAAGGTAAAGAATTAAG
- TGCTGTGCTTTAGATATGCATACACATAAACATCTCAATGCCTTACAGAGCAGTATTGTT
- GCCCACATGTCCCACCTCCAGCCCTAAGGCGGTTTTCCCCTATCTCAGTAGATGGAACAT
- ACAATTGGGTTTTATACCGAGACATTCCATTGCCCAGGGACAGGCAGGAGACAGATGCCT
- TCCTCTTGTCTCAACTGCAAAGAGGCATGCCTTCCTCTTATACTAATCCTCCTCAGCACA
- GACCCTTTACGGGTGTCGAGCTGCGGGACGGTCAGGTCTTTCCCTTCCCACGAGGCCATA
- TTTCAGACTATCACATGGGGAGAAACCTTGGACAATACCTGGCTTTCCTAGGCAGAGGTC
- CCTGTGGCCTTCTGCAGTGTTTGTATCCCTGGGTAGTTGAGATTAGGGCGTGGTGATGAC
- TCTTAAGGAGCATGCTGCCTTCAAGCATCTGTTTAACAAAGCACATCCTGCACAGCCCTT
- AATCCATTTAACCCTGAGTTGACACAGCATGTGTTTCAGAGAGCCTGGGGTTGGGGGTAA
- GGTTATAGATTAACAGCATCTCAAGGCAGAAGAATTTTTCTTAATACAGAACAAAATGGA
- GTCTCCTATGTCTGCTTCTTTCTATACAGACACAGTAACAATCTGATCTCTCTTTCTTTT
- CCCCACA
- GAATGA <- TSR (part of the original sequence that was duplicated upon insertion)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement