Giải trình tự DNA – Lịch sử hình thành

Giải trình tự DNA (DNA sequencing) là kỹ thuật xác định trình tự DNA của các gen cụ thể. Nó bao gồm bất kỳ phương pháp hoặc công nghệ nào được sử dụng để xác định thứ tự của bốn bazơ: adenine (A), guanine (G), cytosine (C) và thymine (T). Sự ra đời của các phương pháp giải trình tự DNA là cột mốc quan trọng giúp đã thúc đẩy rất nhiều nghiên cứu, phát hiện quan trọng trong sinh học và y học.

Khám phá cấu trúc và chức năng của DNA

Axit deoxyribonucleic (DNA) lần đầu tiên được Friedrich Miescher phát hiện và phân lập vào năm 1869, nhưng nó vẫn chưa được nghiên cứu trong nhiều thập kỷ bởi tại thời điểm đó người ta vẫn chưa hình dung được vai trò của DNA.

Tình hình này đã thay đổi từ sau năm 1944 do một số thí nghiệm của Oswald Avery, Colin MacLeod và Maclyn McCarty chứng minh rằng DNA tinh khiết có thể thay đổi một chủng vi khuẩn này thành một chủng vi khuẩn khác. Đây là lần đầu tiên DNA được chứng minh có khả năng biến đổi các đặc tính của tế bào.

Năm 1953, James Watson và Francis Crick đưa ra mô hình chuỗi xoắn kép của DNA. Theo mô hình, DNA được cấu tạo bởi hai chuỗi nucleotide liên kết với nhau bằng liên kết hydro và chạy ngược chiều nhau. Mỗi sợi cấu tạo bởi bốn nucleotide bổ sung – adenine (A), cytosine (C), guanine (G) và thymine (T) – với A trên một sợi luôn bắt cặp với T trên sợi kia, và C luôn bắt cặp với G. Họ đề xuất rằng một cấu trúc như vậy cho phép mỗi sợi được sử dụng để tái tạo lại sợi kia, đây trở thành một ý tưởng trung tâm cho việc truyền thông tin di truyền giữa các thế hệ.

Năm 1955, Frederick Sanger đã hoàn thành trình tự của tất cả các axit amin trong insulin, một loại protein nhỏ do tuyến tụy tiết ra. Điều này cung cấp bằng chứng đầu tiên rằng protein là các thực thể hóa học với một mô hình phân tử cụ thể chứ không phải là một hỗn hợp ngẫu nhiên của vật chất lơ lửng trong chất lỏng. Thành công của Sanger trong việc xác định trình tự insulin đã thúc đẩy các các nhà khoa học như Watson và Crick tiếp tục nghiên cứu thêm về DNA bởi đây là những nhà khoa học đầu tiên tin rằng DNA có vai trò chỉ đạo sự hình thành các protein trong tế bào. Ngay sau khi tham dự một loạt bài giảng của Frederick Sanger , năm 1958, Crick lập luận rằng sự sắp xếp của các nucleotide trong DNA xác định trình tự của các axit amin trong protein, từ đó giúp xác định chức năng của protein. Lý thuyết này đã tạo nền tảng và động lực thôi thúc các nhà khoa học nghiên cứu sâu hơn về trình tự DNA, các kỹ thuật giải trình tự DNA cũng lần lượt ra đời.

Các kỹ thuật giải trình tự

1. Giải trình tự bằng phương pháp hóa học – Maxam-Gilbert sequencing

Vào năm 1977, Maxam và Gilbert đã phát minh được một phương pháp hóa học để có thể giải trình tự một đoạn DNA. Nguyên tắc của phương pháp này là:

(1) Trước hết là phải đánh dấu một đầu của đoạn DNA cần phải giải trình tự bằng một gốc phospho đồng vị phóng xạ (32P);

(2) Xử lý các đoạn DNA đã đánh dấu này với chất hóa học có thể làm biến đổi đặc hiệu một hoặc hai loại base của nucleotide trên đoạn DNA. Ví dụ, dimethylsulphate để biến đổi Guanine bằng cách thêm một gốc methyl ở vị trí nitrogen thứ 7 (N7), hydrazine làm biến đổi Thymine và Cytosine, hydrazine và NaCl để làm biến đổi Cytosine, acid để làm biến đổi Guanine và Adenine, NaOH để làm biến đổi Adenine và Cytosine với Adenine ưu tiên hơn Cytosine. Như vậy trong giai đoạn này, phải dùng ít nhất 4 ống nghiệm và trong mỗi ống nghiệm, DNA được xử lý với một lượng rất giới hạn của một trong các chất hóa học nêu trên để mỗi ống nghiệm chỉ có chứa các đoạn DNA mà trên mỗi đoạn DNA này chỉ có một vị trí nucleotide đặc hiệu với chất hóa học là bị biến đổi;

(3) Các nucleotide bị biến đổi này sẽ bị lấy ra khỏi mạch khung đường-phosphate (sugar-phosphate backbone) của đoạn DNA và nhờ đó tách ra được các đoạn mạch đơn có một đầu đánh dấu 32P và một đầu bị mất phân tử base vì phân tử này đã bị lấy ra khỏi mạch khung (hình 1).

(4) Thực hiện điện di mẫu DNA đã xử lý trong 4 ống nghiệm này trên 4 hàng của một gel polyacrylamide biến tính để các mạch đơn trong mẫu di chuyển trong gel không bị biến đổi trong quá trình điện di. Nhờ đó, sau khi hoàn tất điện di, các mạch đơn sẽ bị dừng tại các vị trí khác nhau, tùy thuộc vào mạch đơn này dài ngắn khác nhau, theo hàng dọc suốt chiều dài của gel. Áp gel đã điện di này trên một phim nhạy tia X, các vị trí dừng lại của các mạch đơn trên gel điện di sẽ tạo thành các vạch trên phim vì các vị trí này đều bị đánh dấu phóng xạ do các mạch đơn đều có một đầu được đánh dấu bằng 32P. Từ các vạch trên phim xạ ký tự ghi này (autoradiography), có thể đọc được trình tự của các nucleotide của đoạn DNA hình 2

Hình 1: Các mạch đơn có một đầu đánh dấu với 32P và một đầu base Guanine bị lấy khỏi mạch khung do bị biến đổi. Các mạch đơn này có chiều dài ngắn khác nhau tùy thuộc vào vị trí của Guanidine trên đoạn DNA.

 

 

Hình 2: : Hình xạ ký tự ghi trên phim nhạy tia X một gel polyacrylamide sau khi đã điện di. Các vạch là vị trí các mạch đơn bị dừng lại sau điện di. Các vị trí này gần hay xa khởi điểm là tuỳ kích thước của mạch đơn dài hay ngắn khác nhau. Từ các vạch này, đọc trình tự của đoạn DNA trong mẫu.

Phương pháp hóa học xác định trình tự DNA của Maxam và Gilbert cho phép sử dụng các mẫu DNA mà không cần nhân bản thêm. Do sử dụng nhãn phóng xạ và độ phức tạp của  kỹ thuật, phương pháp này không được khuyến khích việc sử dụng.

2. Giải trình tự bằng phương pháp kết thúc chuỗi – phương pháp Sanger

Hình 3: Nguyên lý của giải trình tự Sanger

Giải trình tự Sanger được phát triển bởi nhà hóa sinh người Anh Fred Sanger và các đồng nghiệp của ông vào năm 1977. Phương pháp này thực hiện dựa trên kỹ thuật phổ biến là “chain termination- kết thúc chuỗi” bằng việc sử dụng các deoxy nucleotide đã bị chỉnh sửa làm mất nhóm hydroxyl ở đầu 3’ của phân tử đường (phân tử dNTP bị xử lý mất Nhóm 3’-OH trở thành phân tử ddNTP). Nhóm 3’-OH đóng vai trò cho phép gắn thêm một nucleotide mới vào chuỗi. Khi một ddNTP được thêm vào chuỗi, vì không có nhóm 3’-OH nên một nucleotide không được thêm vào, phản ứng tổng hợp sẽ dừng lại. Dựa trên nguyên tắc này, ta tiến hành một phản ứng tổng hợp DNA chứa cả dNTP và một lượng giới hạn ddNTP, sau phản ứng, hình thành các đoạn DNA có độ dài khác nhau do ddNTP gắn ngẫu nhiên làm dừng phản ứng. Dựa vào sự sai khác về độ dài các đoạn DNA hiển thị trên bản gel sau điện di để xác định trình tự trong gene.

Trong thí nghiệm của Sanger, sử dụng 4 ống nghiệm chứa 4 loại ddNTP khác nhau được đánh dấu đồng vị phóng xạ đồng thời được thực hiện phản ứng tổng hợp. Sau đó sản phẩm của 4 ống nghiệm được điện di hiện hình đồng vị phóng xạ trên cùng một bản gel để quan sát các band DNA. Căn cứ vào vị trí các vạch quan sát được trên bản gel mà xác định trình tự các nucleotide theo chiều từ 5 -3 từ dưới lên trên.

Ngày nay người ta sử dụng các máy giải trình tự động để sắp xếp trình tự các band điện di. Kỹ thuật giải trình tự DNA tự động (Dye temination sequencing) sử dụng các ddNTP có đánh dấu huỳnh quang đã giúp cho việc sắp xếp trình tự DNA trở nên nhanh chóng và hiệu quả hơn. Mỗi loại ddNTP được gắn một màu có bước sóng phát xạ huỳnh quang khác nhau cho phép thực hiện giải trình tự trong một phản ứng duy nhất (Hình 4).

Hình 4: Hệ thống giải trình tự tự động – Dye temination sequencing

Hệ thống điện di mao quản được sử dụng để đọc trình tự DNA một cách tự động. Cấu tạo của máy gồm 4 cho tới 24 mao quản chứa gel polyacrylamide cho phép phân tích nhiều mẫu trong một lần điện di. Hệ thống detector gồm các camera có chùm tia laser đi qua nó để ghi nhận tín hiệu huỳnh quang một cách chính xác. Nguyên tắc hoạt động của máy là trong suốt quá trình điện di, khi có một vạch điện di đi qua chùm tia laser thì vạch điện di sẽ phát sáng và được camera ghi nhận và lưu lại thành một cường độ đỉnh sáng (peak) trong biểu đồ. Từ biểu đồ của các đỉnh cường độ sáng này, máy sẽ so dòng của các đỉnh tương ứng với nhau và phân tích thành trình tự của đoạn DNA.

 Giải trình tự Sanger không hiệu quả đối với các dự án quy mô lớn hơn, chẳng hạn như giải trình tự của toàn bộ gen. Các kỹ thuật giải trình tự thế hệ mới cũng lần lượt ra đời đáp ứng cho nhu cầu giải trình tự bộ gen kích thước lớn. Tuy nhiên, cần nhấn mạnh là ,giải trình tự Sanger mang lại trình tự có độ chính xác cao đối với cho các đoạn DNA có chiều dài lên đến khoảng 900 bps, thao tác thực hiện đơn giản dễ tiếp cận. Do đó , giải trình tự bằng phương pháp Sanger thường được sử dụng cho các đoạn DNA riêng lẻ, chẳng hạn như plasmid của vi khuẩn hoặc trình tự DNA đích được khuếch đại sau phản ứng PCR.

3. Giải trình tự thế hệ mới – Next-generation sequencing (NGS)

Hình 5: Một số kỹ thuật giải trình tự thế hệ mới NGS

 

NGS là công nghệ cho phép giải mã đồng thời hàng triệu đoạn ADN trong cùng lúc, qua đó giúp nâng cao hiệu suất của quá trình giải mã hệ gen người. Công nghệ NGS có những ưu điểm: Thời gian đọc nhanh, dữ liệu đầu ra lớn và tiết kiệm chi phí hơn, khắc phục một số nhược điểm của giải trình tự gen truyền thống. Các kỹ thuật giải trình tự thế hệ mới có thể xem là sự kết hợp của sinh học, hóa học, công nghệ nano và cả sinh tin học.Giải trình tự thế hệ mới đang không ngừng phát triển bởi các hãng công nghệ sinh học lớn như Illumina, Qiagen, Roche, …

Bạn có thể tham khảo thêm các phương pháp giải trình tự gen thế hệ mới thông qua đường link:

https://tapchisinhhoc.com/giai-trinh-tu-gen-the-he-moi.html/

Có thể thấy các kỹ thuật giải trình tự liên tục được cập nhật và cải tiến thông qua sự kết hợp của nhiều chuyên ngành Sinh học – Hóa học – Tin Sinh Học – Công nghệ nano – Công nghệ chế tạo máy. Các dữ liệu về trình tự DNA hỗ trợ rất nhiều cho y tế, nghiên cứu phát sinh loài, nhân chủng học… Và hiện nay không khó để một cá nhân có thể tiếp cận công nghệ giải trình tự . Việc ứng dụng rộng rãi kỹ thuật giải trình tự gây ra những tranh luận về đạo đức y học và cả mối lo ngại liệu rằng con người có đang can thiệp quá nhiều vào sự sống, cản trở quá trình sàng lọc tự nhiên.

Tin khác

Đối tác

Copyright 2017 ADN LOCI