Advertisement
Guest User

Untitled

a guest
Jun 24th, 2019
76
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Python 8.47 KB | None | 0 0
  1. def get_not_overlapping_read():
  2.     geneId = "ENSMUSG00000000827"
  3.  
  4.     read_name = "ch361_read8692_template_pass_BYK_CB_ONT_1_FAF04998_A"
  5.     read_size = 1740
  6.     gene_size = 20825
  7.     strand = "+"
  8.  
  9.     # Alignment n°1
  10.     block_tuple_1 = (65, 146)
  11.     read_start1 = 65
  12.     read_stop1 = 146
  13.     read_string1 = "AAACTCTTTCACAGGCTGGACAGAAAACATCAGCTGCCCTGTCCACCATGGGCTCTG-CATCAGCAGGAAGCTTGG-G-TATGAG"
  14.     gene_start1 = 11041
  15.     gene_stop1 = 11125
  16.     gene_string1 = "AAACTCTTTCACAGGCTGGACAGAAAACATCAGCTGCCCTGTCCACCATGGGCTCTGCCATCAGCAGGAAGCTTGGAGACATGAG"
  17.  
  18.     alignIdentity1 = 0.9529411764705882
  19.     alignGap1 = 3
  20.     alignSize1 = 85
  21.     alignString1 = "||||||||||||||||||||||||||||||||||||||||||||||||||||||||| |||||||||||||||||| |  |||||"
  22.  
  23.     # Alignment n°2
  24.     block_tuple_2 = (147, 1512)
  25.     read_start2 = 147
  26.     read_stop2 = 1512
  27.     read_string2 =   "TCCTAAGGTTGTGGGTGGC--AGAGAATGGCGGCGATAACCTCCCT-CCTCTCCTGGAAGTGGTGACCAGACATTGCCGGATCATGCGCCTTTCT-AGCC" \
  28.                      "TGT-CT-GCTTGCCAGCCACAGAGTGC--AAGCACACGCTCATCATC---GCTGCAACTCTGCATGACAGAGCCACCAGCCAGAGACGGTGAAGAGCTGT" \
  29.                      "GGTTTGAAGTGA-TCAT-GCCATGTTCATGCAGATGTGGCTGCC--AGCATGAATT-GAGAACAGTCTTGTACATAAA--TAACACACTAAAGTTCGT-G" \
  30.                      "GT-AAACGAACCACTGTGCCATCCTTTCAAGGGCCACAGGAAATGGACAGGGTGGCGGGGCACTCAGGCCTGAG--GCACTGAACCAGGAGCCCTGCTCC" \
  31.                      "CTTTGAAGGAGTCAGCAGAGTGCTGA-GGAAGAA-TGTGAGTATTG-GTGAACAGTATTTCCTT-CTGACCTCCT-CCCTAGCTCAGGAGGAATACACTT" \
  32.                      "ACCTAGGTAATAT--CATGGTCGCAGTTGTCATACAGACTGAGAGAGAGTTGTCTATTTTCTGAGA-CCT-GA----AAACAT-GTAACTGCTTCATTCT" \
  33.                      "TACACTAACAACCTGGCTTTGGC-GAAGCAGATTTACTA--TTTTAAATGTGATAGTCTTTTCA------AAATAG----AAAAAGTGA-GCAAGACAGC" \
  34.                      "TTTAGCCTCATTGTTGAATATTATTTCTTTGAATTCATGCTGAAACTCAAACCTTACATTGCCTTATGC--TGAACATAGTC-TTTTATATATCTAAATA" \
  35.                      "AATGAAGGTTCTTTAATGGGTTATGATACAATGTAGAA-TTTATTCTGG-CCATCTCATACTCCTGCCAGGCGCAGTTGCTTACA-TTTATTTCTTTAAT" \
  36.                      "ACTTTCTCCT-GTGTTGCAAACTTGGTTCTCTTAAG--GTGGCATTTT-CAATA----ACCACTCTGACCCACAGGGCTCTTGTGCTGTAGGTTAGGAGA" \
  37.                      "GCTGAGAGAA-AAA------CCTTTATCTTTAGCACCTGAATGGGATGTGCCCTGCACAGTGTTGC--TACTGACAGTGGAGCAGAATACCAGTCCCATA" \
  38.                      "GTCTCTTGCCGCATCTGTTTATTACGCTGGAGAATAAATGAACCAGCCTTACAGATC-GGGCGGGGATGTGG-TTTAGTTCAG-CAGAACTCTTTTGTCA" \
  39.                      "TCTTTTCTCTCCAGGAGCTTCAAAGATTTCTTTCTAAGTTCTTTCCTCCTGCTTCCAGTACGCCACATTCTGCAGCCTCTCAATACC-G----ATTTGTG" \
  40.                      "TTGAAATCATG--TTGGAGA-AGGG-CAACACTGTGCCTTAATGGCTCTGCTTGGGGCAAAGACTTTATCTGTTTGTACACATCTCTACACTCCTAGGGT" \
  41.                      "--GGTGG--TTGTTCCATTGGTTCGTTT---GTTAAATATTCAGTATTCCTAGTTTTG"
  42.     gene_start2 = 17938
  43.     gene_stop2 = 19379
  44.     gene_string2 =  "T-CTAAGGTTGTGGGTGGCAGAGAGAATGGCAGCGATAACCTCCCTCCCTCTCCTGGAAGTGGTGACCAGACATTGCCGGATCATGCGCCTTTCTAAGCC" \
  45.                     "TGTCCTAGCTTGCCAGCCACAGAGTACAGAAGCACACGCTCATCATCACAGCTGCAACTCTGCATGACAGAGCCACCAGCCAGAGACAGTGAAGAGCTG-" \
  46.                     "GTTTTGAAGACAGTCATACCCATGTTCATGCAGATGTGGCTGCCTTGGCATGAATTAGAGAACAGTCTTGTACATAAATGTTTTACACTAAAGTTCGTAG" \
  47.                     "ATGAAGCAGACCACTGTGCCATCCTTTCAAGGGCCACAGGAAATGGACAGGGTGGCGGGGCACTCAGGCCTGAGGAGCACTGAACCAGGAGCCCTGCTCC" \
  48.                     "CTTTGAAGGTCTCAGCAGAGTGCTGAGGGAAGAAGTGTGAGTATTGAGTGAACAGTATTTCCTTCCTGACCTCCTCCCCTAGCTCAGGAGGAATACACTT" \
  49.                     "ACCTAGGTAATATCGCATGGTCGCAGTTGTCATACAGACTGAGAGAGAGTTGTCTATTTTCTGAGACCCTAGAAAGGAAACATAGCAACTGCTTCATTCT" \
  50.                     "TACACTAACAACCTGGCTTTGGCAGAAGCAGATTTACTATTTTTTAAATGTGATAGTCTTTTCAAAAATTAAATAGGAAAAAAAAGTGAGGCAAGACAGC" \
  51.                     "TTTAGCCTCATTGTTGAATATTATTTCTTTGAATTCAAGCTGAAACTCAAGCCTTACATTGCCTTATGCTTTGTTTATAGTCTTTTTATATATCTAAATA" \
  52.                     "AATGAAGGTTCTTTAATGGGTTATGATACAATGTAGAATTTTATTCTGGCCCATCTCATACTCCTGCCAGTACCAGTT-ATTACATTTTATTTCTTTAAT" \
  53.                     "ACTTTCTCCTGGTGTGCAAAACTTGGTTCTCTTAAGGAGTGGCATTTTCCAATAGCTTTCCACTCTGACCCACAGGGCTCTTGTGCTGTAGGTTAGGAGA" \
  54.                     "GCTGAGAGAAGAAAAAAAAGCCTTTATCTTTAGCACCTGAATGGGATGTGCCCTGCACAGTGTTGCTTTACTGACAGTGG-GCAGGGCTCTGGT-CCATA" \
  55.                     "GTCTC-TGCC-TGTCTGTTTATTAC-ATGGAGAATAAATGAACCAGCCTTACAGATCAGGTAGGGGATGTGGTTTTGGTTCAGCCAGAACTCTGCTGTCA" \
  56.                     "TCTTTTCT---CAGGAGCTTCAAAGATTTCTTTCTAAGTTCTTTCCTCCTGCTTCCAAT-TGCCACATTCTGCAGCCTCTCAATACCAGGGCCCTGTGTG" \
  57.                     "TTGAGATCATGATTTGGAGAGAGGGCCAGCACTGTGCCTTAATGGCTCTTAGCAGGGCAAAGACTTTATCTGTTTGTACACATCTCTACACTCCTAGGGT" \
  58.                     "GAGGTGGGATTTGTCCATT--TTAGTTTCTGGTTTGACA--CAGTGTGAGGTGTCTTG"
  59.  
  60.     alignIdentity2 = 0.8786008230452675
  61.     alignGap2 = 108
  62.     alignSize2 = 1458
  63.     alignString2 =  "| |||||||||||||||||  |||||||||| |||||||||||||| |||||||||||||||||||||||||||||||||||||||||||||||| ||||" \
  64.                     "||| || |||||||||||||||||| |  ||||||||||||||||||   ||||||||||||||||||||||||||||||||||||| ||||||||||| " \
  65.                     "| |||||||  | ||||  |||||||||||||||||||||||||   ||||||||| |||||||||||||||||||||  |   |||||||||||||| |" \
  66.                     " | || |  |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||  ||||||||||||||||||||||||" \
  67.                     "|||||||||  ||||||||||||||| ||||||| ||||||||||| ||||||||||||||||| |||||||||| ||||||||||||||||||||||||" \
  68.                     "|||||||||||||  ||||||||||||||||||||||||||||||||||||||||||||||||||| ||| ||    |||||| | ||||||||||||||" \
  69.                     "||||||||||||||||||||||| |||||||||||||||  |||||||||||||||||||||||      ||||||    ||||||||| ||||||||||" \
  70.                     "||||||||||||||||||||||||||||||||||||| |||||||||||| ||||||||||||||||||  ||   |||||| |||||||||||||||||" \
  71.                     "|||||||||||||||||||||||||||||||||||||| |||||||||| ||||||||||||||||||||   |||||  ||||| ||||||||||||||" \
  72.                     "|||||||||| ||||   ||||||||||||||||||  |||||||||| |||||     |||||||||||||||||||||||||||||||||||||||||" \
  73.                     "|||||||||| |||      ||||||||||||||||||||||||||||||||||||||||||||||  |||||||||||| ||||    |  || |||||" \
  74.                     "||||| ||||   ||||||||||||  |||||||||||||||||||||||||||||| ||  |||||||||| ||| |||||| |||||||||  |||||" \
  75.                     "||||||||   |||||||||||||||||||||||||||||||||||||||||||||| |  |||||||||||||||||||||||||| |     | ||||" \
  76.                     "|||| ||||||  ||||||| |||| || ||||||||||||||||||||     ||||||||||||||||||||||||||||||||||||||||||||||" \
  77.                     "  |||||  ||  ||||||  || ||||   |||  | |  |||| |     || |||"
  78.  
  79.  
  80.     # Alignment n°3
  81.     block_tuple_3 = (1513, 1680)
  82.     read_start3 = 1513
  83.     read_stop3 = 1680
  84.     read_string3 = "CC--AGAATACTCTACCACACAAAGCAAGGAACAACGAATAACTGGGGAACT---GAAGAGCACACCATTG--GTCTTCTTTT-CAGGGTTAAAAACAATAGCTGTGTGA-GGAACACATTACAGGAGTG--GGT--CTGATATATCTTCCTACAAATATTAGCAGGCAAC--GTCAATAAGG"
  85.     gene_start3 = 19411
  86.     gene_stop3 = 19593
  87.     gene_string3 = "CCTTAGAATACTCTACCACACAAAGCAAGGAACAACGAATAACTGGGGAGCTGAAGAAGAGCACACCATTGGTGTCTTCTTTTCCAGGGTTAAAAACAATAGCTGTGTGAGGGAACACATTACAGGAGTGTAGGTCACTGATATATCTTCCTACAAATATTAGCAGGCAGCTTGTCAATAAAG"
  88.  
  89.     alignIdentity3 = 0.9016393442622951
  90.     alignGap3 = 15
  91.     alignSize3 = 183
  92.     alignString3 = "||  ||||||||||||||||||||||||||||||||||||||||||||| ||   ||||||||||||||||  |||||||||| |||||||||||||||||||||||||| |||||||||||||||||||  |||  |||||||||||||||||||||||||||||||| |  |||||||| |"
  93.  
  94.  
  95.     read = { read_name : {
  96.             block_tuple_1 : {"ReadId": read_name, "ReadSize": read_size, "ReadStart": read_start1, "ReadStop": read_stop1, "Strand": strand, "GeneId": geneId, "GeneSize": gene_size, "GeneStart": gene_start1, "GeneStop": gene_stop1, "AlignIdentity": alignIdentity1, "AlignGap": alignGap1, "AlignSize": alignSize1, "GeneString": gene_string1, "ReadString": read_string1, "AlignString": alignString1},
  97.             block_tuple_2 : {"ReadId": read_name, "ReadSize": read_size, "ReadStart": read_start2, "ReadStop": read_stop2, "Strand": strand, "GeneId": geneId, "GeneSize": gene_size, "GeneStart": gene_start2, "GeneStop": gene_stop2, "AlignIdentity": alignIdentity2, "AlignGap": alignGap2, "AlignSize": alignSize2, "GeneString": gene_string2, "ReadString": read_string2, "AlignString": alignString2},
  98.             block_tuple_3 : {"ReadId": read_name, "ReadSize": read_size, "ReadStart": read_start3, "ReadStop": read_stop3, "Strand": strand, "GeneId": geneId, "GeneSize": gene_size, "GeneStart": gene_start3, "GeneStop": gene_stop3, "AlignIdentity": alignIdentity3, "AlignGap": alignGap3, "AlignSize": alignSize3, "GeneString": gene_string3, "ReadString": read_string3, "AlignString": alignString3}
  99.         }
  100.     }
  101.     return read
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement