Thứ Sáu, 6 tháng 2, 2009

Công cụ chuyển đổi văn bản từ WORD sang TEX

Trong thực tế có rất nhiều văn bản được soạn bằng MS Word cần phải được chuyển đổi sang LATEX, nhất là khi văn bản đó là một bài báo khoa học với những công thức Toán học hết sức phức tạp. Hầu hết các tạp chí Toán học trên thế giới (tại Việt Nam là tạp chí "Acta Mathematica Vietnamica", "Vietnam Journal of Mathematics", nhà xuất bản của các Trường Đại học lớn, ...) đều bắt buộc tác giả phải soạn bài bằng LATEX.
Có rất nhiều cách để thực hiện công việc này.

1. Điều chỉnh file Word bằng cách chuyển các công thức Toán học được đáng máy bằng MathType sang ngôn ngữ của TEX (MathType cung cấp công cụ cực kỳ hữu ích này). Sau đó save as văn bản thành một file .txt và tiến hành dàn trang một cách thủ công dựa vào kinh nghiệm sử dụng LATEX.
2. Save file word sang dạng thức RTF và dùng các chương trình chuyển từ dạng RTF sang TEX ví dụ rtf2tex.exe.

Các công cụ kể trên có thể thực hiện được yêu cầu của công việc nhưng mất khá nhiều thời gian và chưa được hoàn hảo.

Rất may, gần đây các chương trình chuyển đổi đã phát triển đáng kể và điều chúng tôi mong muốn đã được tìm thấy, đó là chương trình Word2Tex của Chikrii Softlab (www.chikrii.com ). Phiên bản hiện tại là Word2Tex 4.1. (Hiển nhiên, trang web www.chikrii.com cũng cung cấp một công cụ ngược lại Tex2Word, đang ở phiên bản 2.5).

Sử dụng Word2tex như thế nào?

Trước hết, bạn install bản dùng thử 30 ngày (cũng có bản crack, bạn tự tìm trên internet). Trên trình đơn của chương trình MS Word sẽ xuất hiện một button là Word2Tex, và trong menu Save as cung cấp thêm dạng TeX chung với các dạng thức truyền thống của Word.
Bạn mở một file .doc bất kỳ cần chuyển đổi, Save as thành dạng TeX, đặt tên thích hợp. Thế là xong!

Hơn thế nữa, Word2Tex còn cung cấp các công cụ thiết thực nằm trong mục setting để chúng ta can thiệp output file. Ví dụ, nó cung cấp một ánh xạ để chuyển các ký tự unicode thành các ký tự trong bảng mã ASCII. Chúng tôi đã tạo ra ánh xạ này để chuyển sang các ký tự VISCII là font chữ hệ thống Tiếng Việt mà chúng tôi đang sử dụng để soạn văn bản với Winedt. Ánh xạ này nằm trong file .wtp (???.wtp), bạn chạy chương trình profman.exe (kèm theo) để import file này vào chương trình. Khi đó, file .doc soạn bằng unicode sẽ tự động chuyển sang mã VISCII.

Chúc các bạn được nhiều may mắn nếu có ý định sử dụng chương trình này.

Không có nhận xét nào:

Đăng nhận xét