Giá trị riêng, véc tơ riêng.

Giá trị riêng và véc tơ riêng xuất hiện cực kỳ nhiều trong các ngành khoa học và kỹ thuật: Vật Lý, xác suất thống kê, KHMT, lý thuyết đồ thị, v.v. Để hiểu ý nghĩa của chúng, có hai hướng nhìn thông dụng, áp dụng được trong rất nhiều trường hợp.

1. Loại động cơ (motivation) thứ nhất.

Trong nhiều ứng dụng ta thường phải làm phép tính sau đây: cho trước một ma trận A và nhiều vectors x, tính {A^k}x với nhiều giá trị khác nhau của số mũ k .

Ví dụ 1: nếu A là ma trận của một phép biến đổi tuyến tính (linear transformation) nào đó, như phép quay và co dãn trong computer graphics chẳng hạn, thì {A^k}x cho ra kết quả của phép BĐTT này áp dụng k lần vào x. Các games máy tính hay các annimations trong phim của Hollywood có vô vàn các phép biến đổi kiểu này. Mỗi một object trong computer graphics là một bộ rất nhiều các vector x. Quay một object nhiều lần là làm phép nhân {A^k}x với từng vectors x biểu diễn object đó. Khối lượng tính toán là khổng lồ, dù chỉ trong không gian 3 chiều.

Ví dụ 2: nếu A là transition matrix của một chuỗi Markov rời rạc và x là distribution của trạng thái hiện tại, thì {A^k}x chính là distribution của chuỗi Markov sau k bước.

Ví dụ 3: các phương trình sai phân (difference equation) như kiểu phương trình 2{a_{n - 1}} + {a_{n - 2}} - 3{a_{n - 3}}  cũng có thể được viết thành dạng {A^k}x để tính {a_k} với k tùy ý.

Ví dụ 4: lũy thừa của một ma trận xuất hiện tự nhiên khi giải các phương trình vi phân, xuất hiện trong khai triển Taylor của ma trận {e^{At}} chẳng hạn.

Tóm lại, trong rất nhiều ứng dụng thì ta cần tính toán rất nhanh lũy thừa của một ma trận vuông, hoặc lũy thừa nhân một vector.

Mỗi ma trận vuông đại diện cho một phép BĐTT nào đó. Lũy thừa bậc k của ma trận đại diện cho phép biến đổi này áp dụng k lần. Ngược lại, bất kỳ phép BĐTT nào cũng có thể được đại diện bằng một ma trận. Có rất nhiều ma trận đại diện cho cùng một BĐTT, tùy theo ta chọn hệ cơ sở nào. Mỗi khi ta viết một vector dưới dạng x = \left( {3, - 2,5} \right)
là ta đã ngầm định một hệ cơ sở nào đó, thường là hệ cơ sở trực chuẩn e_1 = \left( {1, 0,0} \right), e_2 = \left( {0, 1,0} \right),  và e_3 = \left( {0, 0,1} \right) . Các tọa độ 3, -2, 5 của x là tương ứng với tọa độ của x trong hệ cơ sở ngầm định này.

Hệ cơ sở {e_1},{e_2},...,{e_n} như trên thường được dùng vì ta “dễ” hình dùng chúng trong không gian n chiều, chúng là sản phẩm phụ của hệ tọa đồ Descartes cổ điển hay dùng trong không gian 2 chiều. Tuy nhiên, khi áp dụng một phép BĐTT thì các vectors {e_1},{e_2},...,{e_n} thường cũng bị biến đổi theo luôn, rất bất tiện nếu ta phải tính cho nhiều giá trị k và x khác nhau.

Bây giờ, giả sử ta tìm được n hướng độc lập tuyến tính và bất biến qua phép BĐTT đại diện bởi A. (Đây là giả sử rất mạnh, may mà nó lại thường đúng trong các ứng dụng kể trên.) Dùng vector u_i để biểu diễn hướng thứ i. Bất biến có nghĩa là áp dụng A vào hướng nọ thì hướng không đổi. Cụ thể hơn, BĐTT A làm hướng u_i “bất biến” nếu A{u_i} = \lambda_i {u_i} với \lambda_i là một con số (scalar) thực hoặc phức nào đó (dù ta giả sử A là thực). Do các hướng này độc lập tuyến tính, một vector x bất kỳ đều viết được dưới dạngx = {x_1}{u_1} + {x_2}{u_2} + ... + {x_n}{u_n}. Nếu ta lấy {u_1},{u_2},...,{u_n} làm hệ cơ sở thì cái hay là có áp dụng A bao nhiêu lần thì cũng không đổi hướng của các vectors trong hệ cơ sở! Điều này rất tiện lợi, bởi vì {A^k}x = {x_1}{A^k}{u_1} + {x_2}{A^k}{u_2} + ... + {x_n}{A^k}{u_n} = {x_1}{\lambda _1}^k{u_1} + {x_2}{\lambda _2}^k{u_2} + ... + {x_n}\lambda _n^n{u_n}
Như vậy, thay vì tính lũy thừa bậc cao của một ma trận, ta chỉ cần tính lũy thừa của n con số và làm một phép cộng vectors đơn giản. Các giá trị \lambda_i là các trị đặc trưng (eigenvalues) của A, và các vectors u_i là các vector riêng  (eigenvectors).

Tiếp tục với giả thiết rất mạnh là n véc tơ riêng độc lập tuyến tính với nhau. Nếu ta bỏ các vectors này vào các cột của một ma trận U , và các giá trị riêng lên đường chéo của một ma trận B  thì ta có B = {U^{ - 1}}AU. Trong trường hợp này ma trận A có tính diagonalizable (chéo hóa được). Diagonalizability và sự độc lập tuyến tính của n eigenvectors là hai thuộc tính tương đương của một ma trận. Ngược lại, ta cũng có A = UBU^{ - 1} , và vì thế lũy thừa của A rất dễ tính: A = UB^{k}U^{ - 1} do lũy thừa của một ma trận đường chéo $B$  rất dễ tính.

Nếu ta biết được các eigenvectors và eigenvalues của một ma trận thì — ngoài việc tính lũy thừa của ma trận — ta còn dùng chúng vào rất nhiều việc khác, tùy theo ứng dụng ta đang xét. Ví dụ: tích các eigenvalues bằng với định thức, tổng bằng với trace, khoảng cách giữa eigenvalue lớn nhất và lớn nhì của transition matrix của một chuỗi Markov đo tốc độ hội tụ đến equilibrium (mixing rate) và eigenvector đầu tiên là steady state distribution, vân vân.

Quay lại với cái “giả thiết rất mạnh” ở trên. Có một loại ma trận mà giả thiết này đúng; và hơn thế nữa, ta có thể tìm được các eigenvectors vuông góc nhau, đó là các normal matrices. Rất nhiều ứng dụng trong khoa học và kỹ thuật cho ta các normal matrices. Các trường hợp đặc biệt thường thấy là các ma trận (thực) đối xứng và các ma trận Hermitian (đối xứng theo nghĩa phức).

Còn các ma trận không thỏa mãn “giả thiết rất mạnh” này, nghĩa là không diagonalizable, thì làm gì với chúng? Ta có thể tìm cách làm cho chúng rất “gần” với một ma trận đường chéo bằng cách viết chúng thành dạng chuẩn Jordan.

2. Loại động cơ (motivation) thứ hai.

Trong rất nhiều ứng dụng, ta “được” làm việc với một ma trận đối xứng: nó có đủ bộ eigenvectors, do đó diagonalizable và vì thế có thể thiết kế các thuật toán hiệu quả cho các bài toán tương ứng. Không những đối xứng, chúng còn có một thuộc tính mạnh hơn nữa gọi là positive (semi) definite, nghĩa là các eigenvalues đều không âm.

Ví dụ 1: bài toán least squares Ax \approx b có ứng dụng khắp nơi (linear regression trong statistics chẳng hạn) dẫn đến ma trận symmetric positive (semi) definite {A^T}A

Ví dụ 2: bài toán xác định xem một một điểm tới hạn của một hàm đa biến bất kỳ có phải là điểm cực tiểu hay không tương đương với xác định xem ma trận đối xứng Hessian của các đạo hàm bậc hai tại điểm này là positive definite.

Ví dụ 3: ma trận covariance của một random vector (hoặc một tập hợp rất nhiều sample vectors) cũng là positive (semi) definite.

Nếu A là một ma trận symmetric positive definite thì ta có thể hiểu các eigenvectors và eigenvalues theo cách khác. Bất phương trình {x^T}Ax \le c
trong đó c là một hằng số dương là một bất phương trình bậc 2 với n biến {x_1},{x_2},..,{x_n} (các tọa độ của vector x). Nghiệm của nó là các điểm nằm trong một hình e-líp trong không gian n chiều (Ellipsoid) mà n trục của ellipsoid chính là hướng của các eigenvectors của A, và chiều dài các trục tỉ lệ nghịch với eigenvalue tương ứng (tỉ lệ với nghịch đảo của căn của eigenvalue). Đây là trực quan hình học phổ biến thứ hai của eigenvectors và eigenvalues.

Tham khảo từ blog Khoahocmaytinh.

About tuongnm_phuongdt

Hạnh phúc với những gì đang có
This entry was posted in Toán cao cấp 1. Bookmark the permalink.

Có 4 phản hồi tại Giá trị riêng, véc tơ riêng.

  1. nguyễn tiến đạt nói:

    thưa thầy .thầy giải giúp phần a của bài 4.13 trog giáo trình.
    .em tìm đươc phần b nhưng không biết làm phần a ra sao ạ. em đọc trên mạng có cách làm như sau không biết có đúng không m0ng thầy giải đáp giúp em .em cảm ơn thầy :
    Cho ánh xạ tuyến tính F: R^3—>R^2 , biết f(1,1,0)=(2,-1),f(1,1,1)=(1,2),f(101)=(-1,1).
    Tìm f(3,5,1).
    giải:
    giả sử (3,5,1)=a(1,1,0)+b(1,1,1)+c(1,0,1) .sau đó giải hệ ra đc a=-2,b=3,c=2
    =>f(3,5,1)=f(a(1,1,0)+b(1,1,1)+c(1,0,1))
    f(3,5,1)=af(1,1,0)+bf(1,1,1)+cf(1,0,1)
    f(3,5,1)=-2(2,-1)+3(1,2)+2(-1,1)=(-3,10).

    • Damthanhphuong nói:

      Tư tưởng em giải như vậy là đúng rồi. Nói chung cứ cho ảnh của một cơ sở thì làm được hết mấy yêu cầu sau: Tìm ảnh của một véc tơ, tìm Kerf, Imf, tìm ma trận, giá trị riêng, véc tơ riêng…Từ trước chúng ta hay dùng cơ sở chính tắc để giải quyết mấy các yêu cầu đó nên các em thấy lạ lẫm. Giờ thảo luận thầy sẽ nói chi tiết.

  2. nguyễn tiến đạt nói:

    à thấy cho em đáp án phần a luôn nhé .em cảm ơn thầy

  3. nguyễn tiến đạt nói:

    thưa thầy cũng sắp thi rùi thầy có thể post cho chúng em một số đề thì của năm tr đc không ạ

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s