Bạn đang ở: Trang chủ / Nhân vật / Nhớ Phước

Nhớ Phước

- Hồ Tú Bảo — published 14/01/2015 15:50, cập nhật lần cuối 12/04/2016 22:22

Nhớ Phước


Hồ Tú Bảo



phuoc-bao-tp
Trong một chuyến làm việc ở quê hương (ảnh báo tiền phong)

Mỗi sáng thức dậy, việc đầu tiên của tôi là bật cái laptop bên cạnh để đọc nhanh các emails gửi tới trong đêm. Sáng nay tin đến thật bất ngờ, Phước bị tai biến và mất sau một ngày. Sững sờ.

Tôi gặp Phước lần đầu vào đầu năm 1990 khi đang làm việc ở Viện Công nghệ Thông tin (IOIT) ở Hà Nội. Phước và anh Hoàng về Việt Nam theo chương trình TOKTEN của Liên hiệp quốc. Bữa đó Viện tổ chức seminar mời hai anh nói về internet và email, những thứ mới phổ biến ở Mỹ và còn xa lạ ở Việt Nam. Phước và anh Hoàng nói chuyện nhẹ nhàng và dí dỏm, cho người nghe cảm nhận được sự thay đổi to lớn do email và internet mang lại. Có thể phần nào từ câu chuyện hấp dẫn này, vài năm sau IOIT là một nơi đi đầu đưa internet vào Việt Nam (IOIT khi đó quy tụ nhiều người giỏi và năng động về tin học, có không khí nghiên cứu. Đầu năm 1979 khi mới đi làm tôi vẫn thường nghe mọi người xuýt xoa về những câu chuyện ấn tượng của hai anh Hà Dương Tuấn và Phan Huy Đường trong đợt làm việc ở IOIT).

Tôi không làm cùng chuyên môn với Phước nhưng quen nhau qua người bạn từ hồi đi học, Ngô Trung Việt, đã làm việc nhiều với Phước, anh Nhàn và anh Hoàng về chuẩn chữ Việt. Tuy quen muộn nhưng cùng tuổi cùng học toán rồi làm tin học, chúng tôi nói được với nhau nhiều chuyện. Cuối năm 1991 tôi có dịp lần đầu qua Mỹ vài tháng, và trong chuyến đến Cali thăm các hãng Apple và Sun Microsystems, Phước đón tôi về nhà mấy ngày cuối tuần. Khi ấy Phước đang làm ở Mentor Graphics, và mấy tối đó Phước nói cho tôi nghe nhiều về mã chữ Việt. Tôi còn được thức hai đêm đọc gần hết chồng báo Diễn Đàn ở nhà Phước. Từ đó, tôi luôn để ý về công việc Phước và nhóm bạn âm thầm làm việc cho bộ mã chữ Việt.

soba

Cùng đi ăn soba ở Nhật

Chắc ai cũng nhớ chúng ta đã khó khăn thế nào khi dùng chữ Việt trên máy tính trong nhiều năm, mỗi khi mở các tệp văn bản trên máy tính gặp nhiều chữ lạ. Khi máy tính cá nhân ra đời, rất nhiều bộ mã 8-bit cho chữ Việt đã xuất hiện. Mãi về sau chúng ta mới có bộ chữ Việt thống nhất và tiện lợi như ngày nay theo mã Unicode. Quãng thời gian này dài chừng hai mươi năm, và đằng sau những tháng năm đó là câu chuyện tìm giải pháp kỹ thuật cho mã chữ Việt mà nhiều người, trong đó có Phước, đã kiên trì theo đuổi.

Đại thể, để in ấn và hiện chữ Việt lên màn hình máy tính ta cần kết hợp 5 dấu thanh vào các nguyên âm trong 33 chữ cái tiếng Việt và do đó cần có 186 ký tự để mã hoá toàn bộ chữ Việt; nhưng trong bảng mã ASCII (128 ký tự đầu của bảng mã 8 bits) dùng trong tiếng Anh trước đó đã có 52 ký tự chung với chữ Việt, nên còn cần 134 chỗ nữa. Giới công nghệ thông tin (CNTT) đã tạo ra một giải pháp “đi vòng” trong đó có một số ký tự phải dùng hai vị trí mã. Tuy nhiên, không một quy tắc đơn giản nào nhận được sự đồng thuận cho thủ thuật đó. Đã xuất hiện chừng 40 bảng mã do các nhóm khác nhau làm cho chữ Việt. Ta sẽ không đọc được một văn bản soạn theo một bảng mã trên máy khác nếu máy của ta không có bảng mã này.

Các bảng mã kể trên được chia thành hai nhóm, nhóm mã dựng sẵn (một mã cho một dáng chữ) và nhóm mã tổ hợp (gắn dấu thanh vào các phụ âm và nguyên âm). Có thể sau một thời gian dài cô lập với nền CNTT trên thế giới vì cấm vận và không có liên hệ với các nhóm công tác của ISO về mã hoá cho chữ viết của các ngôn ngữ, xu hướng làm mã dựng sẵn đã phổ biến và thắng thế ở Việt Nam vào cuối những năm 1980, tuy không một cách làm nào nhận được sự đồng thuận. Mã tổ hợp, tuy chưa dễ dùng do giới hạn của máy tính ở thời điểm đó, lại có nhiều ưu điểm sâu xa nếu cảm nhận rõ được sự tiến bộ và con đường phát triển của giới công nghiệp CNTT. Từ giữa những năm 1980, anh Ngô Thanh Nhàn dựa trên đặc điểm tiếng Việt và mở rộng bộ mã ASCII của Mỹ đã bắt đầu nghiên cứu mã tổ hợp cho chữ Việt. Rồi Phước cùng anh Nhàn, anh Hoàng đề xuất một cách mã hoá chữ Việt độc đáo theo kiểu tổ hợp, công bố trên tạp chí Computer Standards & Interfaces (1.1992). Tiểu ban xây dựng bộ mã chuẩn 8-bit cho chữ Việt (gọi tắt là Tiểu ban, do anh Trần Lưu Chương phụ trách) hoàn toàn đồng ý chọn giải pháp này và bộ mã chuẩn tiếng Việt TCVN 5712 được ban hành. Chính từ TCVN 5712, với những nỗ lực tiếp theo của Phước và nhóm cũng như sự ủng hộ của Tiểu ban, Microsoft đã tạo bảng mã CP 1258, IBM tạo bảng mã CP 1129 cho chữ Việt, cũng như phần mềm xử lý văn bản ABC phổ biến ở Việt Nam.

Công việc rất ý nghĩa này chính là những bước đầu trên con đường của bộ mã chữ Việt ngày nay theo tiêu chuẩn Unicode, được dùng thống nhất, thuận lợi, đáp ứng các yêu cầu của việc phát triển và sử dụng chữ Việt trên máy tính.

Mỗi người “yêu tiếng nước tôi” theo cách của mình. Phước đã yêu tiếng Việt với sự am hiểu sâu rộng về tiến bộ công nghệ và đóng góp những ý kiến sâu sắc có tính chiến lược để gắn chữ Việt với sự phát triển của CNTT trên thế giới. Làm ra bộ mã đã khó, nhưng làm sao để các công ty lớn cho bộ mã này vào máy và phầm mềm của họ còn khó hơn. Anh Nhàn nói phần này Phước rất giỏi.

Tiếp theo TCVN 5712, Phước và nhóm tiếp tục một chặng đường thầm lặng: Mã hoá chữ Nôm trên máy tính. Đây thật sự là một mục tiêu vượt ra ngoài sự hình dung và quan tâm của hầu hết người Việt vào lúc đó. Câu chuyện khởi nguồn từ năm 1984 khi anh Phan Đình Diệu đưa anh Nhàn, trong lần thăm IOIT, một cuốn sách chữ Nôm và hỏi làm sao đưa vào máy tính. Đây là một câu hỏi lớn, vì chỉ có tạo được chữ Nôm lên máy tính như cách viết chữ quốc ngữ, ta mới có thể bảo tồn lâu dài và dùng được thuận tiện khi công nghệ tiến bộ hơn, tất cả những văn bản cha ông đã tạo ra trước khi có quốc ngữ. Giữ được chữ Nôm trên máy tính chính là dựng được một cây cầu nối chúng ta với quá khứ của dân tộc. Và phải ý thức sâu sắc chuyện này mới có thể dấn thân vào con đường dài của mã hoá chữ Nôm.


honolulu
Phước và anh Nhàn ở cuộc họp CJK-JRG tại Honolulu, 1992


Để có thể giữ được trên máy tính và khai thác tự động chữ Nôm như nhận dạng, in ấn... trước hết cần phải mã hoá chữ Nôm. Để làm việc này Phước và nhóm đã tham gia rất nhiều cuộc họp của nhóm CJK (China-Japan-Korea) về mã hoá chữ biểu ý cũng như các nhóm WG2 liên quan việc đưa chữ Nôm vào Unicode. Những nhóm công tác này họp nhiều lần mỗi năm ở nhiều nơi khác nhau, mỗi lần ròng rã nhiều ngày. Tôi đã một lần dự ké cho biết khi có cuộc họp ở Tokyo. Đối với tôi đấy là một cuộc họp rất khó và dài, có phần buồn tẻ vì chỉ mã của một chữ do ai đấy đề nghị cũng phải bàn bạc, tranh cãi rất lâu. Nhưng Phước và nhóm đã tham dự rất nhiều cuộc họp như vậy, vì không đi họp thì không ai bảo vệ quyền lợi và đăng ký để chữ Nôm được cấp mã trong Unicode và ISO. Làm được điều này nghĩa là những chữ Nôm sẽ tồn tại vĩnh viễn cùng các bộ chữ khác trên thế giới và được công nghiệp CNTT hỗ trợ toàn cầu. Không thể không nói chuyện người đi họp đã tự bỏ tiền túi cho mọi chi phí, dành hết ngày nghỉ cho những chuyến đi. Những nỗ lực này là vô giá vì bộ chữ CJK (Chinese-Japanese-Korea) với 74.617 chữ biểu ý của ba nước Trung-Nhật-Hàn trong Unicode đã được mở rộng thành bộ chữ CJKV có thêm 4232 chữ thuần Nôm của Việt Nam. Về sau, chữ Chăm và chữ Thái cũng được các anh bổ sung vào bộ chữ này.

cjkv
Bìa cuốn sách CJKV (in lần thứ hai)

Phước dành nhiều thời gian để giới thiệu công nghệ thông tin của Việt Nam với cộng đồng quốc tế. Bài viết Vietnam: Information Technology for the Transition” của Phước, anh Phan Đình Diệu và Giáo sư Goodman S.E. đăng trên tập san IEEE Computer năm 1996 đã giới thiệu một bức tranh toàn diện về sự thay đổi của CNTT ở Việt Nam khi kế hoạch tổng thể của chương trình quốc gia giai đoạn 1995-2000 được phê duyệt và thực hiện.

Với tôi những ngày không bao giờ quên là khi nhóm chuyên gia công nghệ thông tin từ Mỹ và Châu Âu thường xuyên về Việt Nam làm việc: Phước, Tiến, anh Hoàng, anh Tuấn... Dù không trong nhóm nhưng thỉnh thoảng tôi được tham gia ké, lúc ở các trại huấn luyện công nghệ thông tin ITBC1, lúc là những lần gặp ở Việt Nam, hay đâu đó ở Cali, Geneva hay Paris.

Vài năm trước khi về hẳn Việt Nam, Phước thường được công ty cử qua Nhật làm việc với khách hàng, và chúng tôi thỉnh thoảng có dịp gặp nhau. Một lần tôi mời Phước đến Trường và mời nhóm sinh Việt Nam đến nghe chuyện mã chữ Việt và CJKV. Phước say sưa và các bạn trẻ hào hứng. Sao quan trọng thế mà chưa biết nhỉ!

Từ khi Phước về Việt Nam làm việc, chúng tôi ít có dịp gặp nhau hơn. Lần gặp cuối vào tháng 4.2013 khi Phước đưa mẹ và Ánh, Minh qua Nhật vào dịp hoa anh đào nở, và đến thăm thành phố nơi tôi ở. Phước chuẩn bị chuyến đi cho tháng 4.2011, nhưng cơn động đất lớn ở Nhật đã làm kế hoạch chậm lại hai năm.

Phước, anh Nhàn, anh Trần Lưu Chương và Việt nằm trong số những người đầu tiên được giới CNTT Việt Nam trân trọng trao tặng biểu trưng “hiệp sĩ công nghệ thông tin”. Phước thích giải này, vì logo của nó là con vịt vác tù và ... làm chuyện bao đồng.

Nhớ đến Phước là nhớ đến nụ cười rất đẹp, những nhận xét rất riêng, những ý kiến bất ngờ, những băn khoăn không giấu, những thầm lặng và mạnh mẽ.

Thôi Phước đi.

Hồ Tú Bảo



Tham khảo


  1. James Đỗ, Chữ Việt trong máy tính: Tiến tới tiêu chuẩn thống nhất. Diễn Đàn, 11.1992,
    http://www.diendan.org/tai-lieu/bao-cu/so-013/chu-viet-trong-may-tinh.

  2. James Đỗ, Ngô Thanh Nhàn, Nguyễn Hoàng, A proposal for standard Vietnamese character encodings in a unified text processing framework. Computer Standards & Interfaces 14 (1/1992):3-12,
    http://dl.acm.org/citation.cfm?id=176430.

  3. Ngô Thanh Nhàn, James Đỗ, Nguyễn Hoàng, Introduction to Nôm - a Vietnamese script - for computer character encoding. Paper presented at the Unicode Han Subcommittee Meeting, May 7, 1992 at Xerox Corporation, Palo Alto, CA. Document No. HCS 92-3-2 and 3.

  4. Nguyễn Hoàng, Chữ Nôm. Diễn Đàn., 2.1992, http://www.diendan.org/tai-lieu/bao-cu/so-016/chu-nom.

  5. Ngô Trung Việt, Câu chuyện mã hóa Tiếng Việt và Unicode. PC World, 4.2004,
    http://www.pcworld.com.vn/ArticlePrint.aspx?ArticleId=1186075.

  6. Hồ Văn Tiến, Tưởng nhớ anh Đỗ Bá Phước (James Đỗ). Diễn Đàn, 1.2015
    http://www.diendan.org/nhung-con-nguoi/do-ba-phuoc-1952-2015.



1 ITBC (Information Technology Boot Camp), như tên gọi tiếng Anh, là một “trại huấn luyện” ở cường độ cao về công nghệ thông tin. Từ đầu năm 2001 đến cuối năm 2005 đã có bốn đợt trại huấn luyện ITBC tổ chức ở Hà Nội, Tp Hồ Chí Minh và Đà Nẵng với học viên đến từ nhiều tỉnh thành, chủ yếu do một nhóm chuyên gia người Việt tại Mỹ, Thuỵ Sĩ và Pháp về nước làm giảng viên. Nói chung mỗi trại huấn luyện như vậy tranh thủ thời gian tối đa để giới thiệu những nét phát triển chính của công nghệ và các tài liệu cần có để người nghe tự nghiên cứu về sau. ITBC kéo dài khoảng một tuần, không thể hơn vì rất căng, người tham dự được yêu cầu thoát ly hoàn toàn công việc thường ngày. Có mặt suốt ngày, nghe giảng, thảo luận, ăn uống, nghỉ ngơi, du ngoạn chung. ITBC dành cho cán bộ quản lý và kỹ sư trưởng trong nghiên cứu phát triển CNTT.



Các thao tác trên Tài liệu

Các số đặc biệt
Ủng hộ chúng tôi - Support Us