User Profile

Profile Image

honesto denise

Bio Statement

 Um artigo deixou claro o que é uma "inserção"?

Na época, Xingyou estava interessado no que a Insertsize pode fazer e, mais tarde, ele sabia que realmente queria entender: qual é o segmento de pastilhas. Talvez para muitos pássaros crentes crentes, isso não seja um problema, às vezes seja familiar demais para parecer óbvio, mas, no final, ela fecha os olhos. Mas eu não sei que, para muitos iniciantes, especialmente iniciantes transnacionais que desconhecem completamente a tecnologia NGS, não é um problema simples (na verdade, nem sempre é uma tarefa fácil entender problemas simples). Acredito que muitas pessoas terão mais ou menos confusão semelhante quando virem isso pela primeira vez. Já tive essas dúvidas antes. Não entendo o que é um "segmento de inserção" ou mesmo por que existe um "segmento de inserção". "A palavra. Portanto, neste artigo, falamos principalmente sobre o que é a inserção do sequenciamento de segunda geração e quais são suas características. O que é o Insert? "Inserir segmento" é expresso no termo em inglês "Inserir". Esse termo tem uma longa história e existia antes do desenvolvimento da tecnologia NGS.Era uma época da E. coli como um recipiente para a clonagem de DNA. Inserir era uma palavra padrão na época, referindo   inscrições enem 2020             -se à implantação de uma sequência de DNA no genoma de E. coli, usando a auto-proliferação e a clonagem de E. coli para atingir o objetivo de amplificar essa sequência de DNA. O fragmento inserido é chamado fragmento de inserção e é expresso em tais palavras que é uma sequência de DNA estranha inserida em E. coli. No NGS, embora a questão da amplificação ainda seja apenas necessária, o vetor deixou de ser E. coli, mas outras técnicas de amplificação de sequência (descritas em detalhes abaixo), mas como a forma é um pouco semelhante, o termo tem sido Usado para baixo. Então, o que exatamente é esse inserto no sequenciamento de alta taxa de transferência e de segunda geração de segunda geração? Para explicar melhor, preciso mencionar o processo de sequenciamento novamente. O primeiro passo no sequenciamento é construir uma biblioteca de sequenciamento de DNA apropriada. As etapas de construção desta biblioteca são geralmente as seguintes: usando a tecnologia de digestão por ultrassom ou enzima para quebrar uma pilha de DNA bagunçado extraído das células e, em seguida, reparar as extremidades, suavizar as seqüências finais bifurcadas; gel de corrida de campo elétrico, o termo profissional é condensação As moléculas de eletroforese-DNA em gel "nadam" em um campo elétrico. Devido à carga diferente de fragmentos de DNA de diferentes comprimentos (todos eles são carregados negativamente), sob a ação do campo elétrico, alguns correm mais rápido e outros diminuem.Após um período de tempo, fragmentos de DNA de diferentes comprimentos serão separados no campo elétrico, como segue Figura 1. Figura 1. A eletroforese em gel permite a separação de fragmentos de DNA de diferentes comprimentos 3. Com base em 2, selecione sequências de DNA de um comprimento específico - por exemplo, selecionamos a sequência de 400 bp de comprimento na figura acima, elas são o que queremos sequenciar A sequência principal, ou seja, a "inserção" a ser implantada. É apenas que, no sequenciamento de segunda geração, ele não é implantado em E. coli, mas os adaptadores para sequenciamento são adicionados às suas duas extremidades e, em seguida, a amplificação da sequência (PCR) é realizada e, finalmente, a máquina é sequenciada. Depois de adicionar o conector, ele se parece com a Figura 2. Em todo o fragmento (Fragmento), as partes em azul escuro nas duas extremidades são adaptadores de sequenciamento, e a parte em azul claro no meio é a nossa sequência de DNA, que é a chamada inserção.O comprimento da inserção (Insertsize) refere-se a O comprimento desta parte azul clara. As articulações adicionadas nas duas extremidades têm duas funções principais: a primeira é semelhante à função "mão", que é muito importante, o objetivo é permitir que nossas sequências de DNA passem por essas articulações e os "bits de sequenciamento" no chip de sequenciamento. "Segure" e corrija-o para concluir o processo de seqüenciamento; a segunda função é a diferenciação de amostra. Isso acontece quando várias amostras são misturadas e sequenciadas na mesma máquina, ou seja, o que é comumente chamado de seqüenciamento de pool. Obviamente, a estrutura do conector de seqüenciamento é realmente um pouco mais complicada do que a figura, mas aqui eu a simplifiquei para a conveniência da expressão e apenas desenhei uma. Figura 2. Diagrama esquemático da estrutura da pastilha Além disso, o comprimento real dessa sequência de pastilhas azuis claras no meio não pode ser conhecido com precisão. Como não podemos contar diretamente o número de bases nesses fragmentos, podemos apenas sequenciar. No entanto, a tecnologia de sequenciamento de leitura curta e segunda geração de segunda geração só pode ser medida a partir de uma extremidade ou duas extremidades desse fragmento azul claro.Por exemplo, a imagem mostra o sequenciamento Pair-End (PE) *, que mede duas extremidades. A sequência é Read1 e Read2. Em muitos casos, o comprimento de Read1 + Read2 é menor que o comprimento do segmento inserido. No caso de não testável, deve haver uma sequência de comprimento desconhecido no meio da qual não podemos medir.Esta sequência não detectada às vezes é chamada de         Inscrições BBB 2021     

 sequência interna e seu comprimento é a distância entre Read1 e Read2 (Figura 2 A sequência indicada pela seta dupla vermelha). * No sequenciamento de segunda leitura longa de segunda geração (séries Illumina ou BGISEQ, etc.), seja WGS, WES, WGBS, RRBS ou RNAseq, existem dois tipos diferentes de sequenciamento para escolher: Sequência de extremidade única (extremidade única, denominada SE) E Sequenciamento de ponta de par (Pair-End, PE para abreviar). A sobreposição entre Read1 e Read2 Às vezes, a sobreposição entre Read1 e Read2 não significa que as duas sequências estejam conectadas (ao sequenciar, Read1 e Read2 são geradas separadamente, em vez de iniciar ao mesmo tempo, é impossível conectar-se. ), Mas os fragmentos cobertos um pelo outro foram detectados um pelo outro, como mostra a Figura 3 abaixo. Como isso aconteceu? Existem duas situações que podem causar esse fenômeno: Figura 3. Read1 e Read2 têm inserções muito curtas e se sobrepõem durante o sequenciamento.O comprimento de leitura do sequenciamento é maior.Por exemplo, o comprimento de leitura do MiSeq pode atingir 250 pb. Se for, o Read1 + o Read2 atingirá 500 pb. Se o comprimento da sequência de construção da nossa biblioteca for de 400 pb, ele será testado e haverá cerca de 100 pb no meio da área em que o Read1 e o Read2 se sobrepõem (a área de sobreposição vermelha na Figura 3); Segundo, os erros causados ao criar o banco de dados. Embora todos desejemos poder selecionar as inserções a serem processadas ao construir a biblioteca de seqüenciamento, e seus comprimentos podem ser basicamente os mesmos, mas, na verdade, isso não pode ser feito, deve haver desvios. Às vezes, quando a qualidade da biblioteca é ruim, o desvio é ainda maior. Por exemplo, a figura a seguir é um mapa real de distribuição do comprimento da inserção de dados. Este não é um bom resultado da construção da biblioteca. Podemos ver que ele possui um comprimento grande na extremidade esquerda. Ambos estão abaixo de 200 pb, mesmo tão baixos quanto 50 pb. Portanto, se estivermos sequenciando por 100PE, também haverá sobreposição nesta parte da sequência. Fig. 4. A sobreposição da distribuição do comprimento do fragmento de pastilha afetará negativamente nossa análise de dados? Basicamente, não e, para o segundo caso, geralmente não há necessidade de fazer processamento extra, apenas análise normal.

 

Para o primeiro caso, geralmente é projetado deliberadamente (é claro que não é necessário usar o MiSEQ, o outro também é bom, desde que o segmento de inserção e o comprimento de leitura de leitura possam ser ajustados). Em algumas análises de dados, selecionaremos deliberadamente inserções curtas para garantir a leitura de Read1 e 2. Por exemplo, no contexto da montagem do genoma, ao projetar bibliotecas de gradiente, geralmente haverá uma biblioteca de tamanho pequeno, o objetivo é colocar esse tamanho pequeno O Read1 e o Read2 da biblioteca estão conectados para sintetizar um Super Read, que pode auxiliar na construção de sequências e preenchimento de buracos, e melhor montar o gene da espécie. Além disso, existem algumas boas ferramentas que podem ser usadas para mesclar tais leituras sobrepostas, como pandaseq: http://pandaseq-tutorial.readthedocs.io/en/latest/tutorial/ Além da sobreposição de leitura acima, também há uma O caso especial é chamado: passe de teste. É uma extensão adicional da sobreposição de Read. O motivo é o mesmo, ou seja, algumas inserções são muito curtas, fazendo com que Read abranja completamente toda a inserção. Por exemplo, na Figura 4, todas as inserções com comprimento inferior a 100 pb serão testadas. Além disso, as sequências de ligação nas duas extremidades do fragmento podem ser detectadas diretamente. A Figura 5 abaixo é um diagrama esquemático de um teste de sequência.Este é um fenômeno que não queremos ver e é a principal fonte de contaminação do conector no Read. Essa também é a razão pela qual a sequência do conector geralmente aparece no final da leitura e precisamos do adaptador de corte para fazer o mesmo. Figura 5. A inserção é curta, o que leva a uma passagem.O comprimento da inserção na extremidade de leitura reflete a qualidade do seqüenciamento? Embora, quando a inserção é selecionada após a execução do gel, haja um erro inevitável em seu comprimento, haverá flutuações e, às vezes, as flutuações não são pequenas, mas não podem refletir a qualidade do seqüenciamento (o metoparca é excluído aqui). Como a qualidade do sequenciamento não é diretamente afetada pelo comprimento do fragmento inserido, é determinada por sistemas mais complexos e fatores externos, como reagentes, chips de sequenciamento, câmeras ópticas, operação da máq       alistamento militar           uina, ambiente de laboratório (terremoto, exposição) e assim por diante. O papel do par-final e do comprimento da pastilha: melhore a detecção de mutação Embora a tecnologia de sequenciamento de leitura curta de segunda geração não possa obter um comprimento de leitura de leitura ultra-longo, mas os Read1 e Read2 obtidos pelo sequenciamento de pair-end (Pair-End) contêm três Informações úteis sobre o relacionamento são: conectadas uma à outra, distância e direção da sequência. Esta informação é o principal sinal para detecção de variação genômica, especialmente para detecção de variação estrutural. Na verdade, eu falei sobre como usar o Read Pair (ou seja, informações sobre PE) para realizar a detecção de mutação em "Um artigo explicando o método de detecção de variação estrutural do genoma", que não será repetido aqui. Se você não entender, você pode Dê uma olhada no passado.Em resumo, ele pode detectar muitos tipos diferentes de mutações estruturais, como a seguir: Figura 6. Resumo dos tipos de mutações que podem ser detectadas pelo RP Então, aqui está o que é a inserção. ---- / END / ---- ※ ※ ※ Você também pode ler as práticas recomendadas de análise de dados em todo o genoma do GATK4. Utilizo este artigo como um sinal para encerrar a atual série WGS de problemas de processo de análise de dados do WGS principal. Estou resolvendo a espiral Mineiro, adoro como as ciências da vida devem aprender a se auto-apresentar à bioinformática.Este é o planeta do conhecimento: "Desaparafuse o círculo de troca de tecnologia", um círculo pessoal de amigos com meus leitores. Tenho 9 anos de experiência em pesquisa e bioinformática de ponta e completa no campo da NGS. Publiquei muitos artigos científicos sobre o nível de Natureza e Célula nesse campo. Também espero usar esse planeta do conhecimento para compartilhar algumas de minhas experiências escassas com mais Parceiros interessados em omics. Este é o primeiro círculo no planeta do conhecimento que está verdadeiramente fortemente relacionado à genômica e bioinformática, e também é um excelente planeta oficialmente classificado. Espero criar um círculo de conhecimento e uma rede de ômicos de alta qualidade: fazendo perguntas, compartilhando uns com os outros, trocando experiências, experiências etc., podemos aprender um com o outro melhor e aprimorar a capacidade de análise e interpretação de dados genômicos. Aqui você pode se familiarizar com excelentes especialistas nacionais em genômica e bioinformática e, ao mesmo tempo, pode compartilhar sua experiência, idéias e raciocínio. Se você tiver alguma dúvida, também pode me fazer perguntas e as estrelas do círculo.