|
Website thâm
nhập vào Việt Nam từ những năm
1995-1996. Khi đó việc thiết lập nên một
Website là cả một vấn đề. Vào thời
kỳ đó, người ta xây dựng một
Website thông qua việc viết các tệp siêu văn
bản HTML với các thẻ của nó bằng các
tŕnh soạn thảo thông thường như NotePad,
WordPad, cao cấp hơn th́ sử dụng Hotdog,
Hotmetal có hỗ trợ một vài công cụ
để giảm bớt sự nặng nhọc
khi phải viết các thẻ HTML.
Vào giữa năm 1996, t́nh h́nh trên đă
được cải thiện rất nhiều khi
xuất hiện các sản phẩm như MS Word
Assistance, cho phép soạn thảo các tệp văn
bản Word rồi lưu chúng dưới dạng
các tệp siêu văn bản HTML ngay trong Word từ
phiên bản 6.0 rồi tiếp tục cho tới các
phiên bản Word sau này với những cải
tiến ngày một lớn. Tiếp đó là các công
cụ mạnh như Microsoft FrontPage 98/2000, Microsoft
Office 97/2000/XP, ColFusion, Dreamwave và nhiều công cụ
khác hỗ trợ việc xây dựng các tệp siêu
văn bản HTML một cách dễ dàng. Theo
hướng này, rất nhiều các Website đă
được ra đời và được
biết tới như những Website tĩnh, hiểu
theo nghĩa là các Website được xây dựng nên
bởi sự liên kết giữa các tệp văn
bản HTML mà không có sự tham gia của bất
cứ một hệ quản trị cơ sở
dữ liệu nào. Tuy nhiên, khi dữ liệu trở nên
nhiều hơn và đa dạng hơn, hầu
hết mọi nơi đều nghĩ tới
việc xây dựng các Website có sự kết hợp
với các hệ quản trị cơ sở dữ
liệu.
Cuối năm 1996,
đầu 1997, tại Việt Nam, công nghệ Active
Server Page của Mỉcrosotf bắt đầu
được nhiều người biết
tới. Cùng với nó, việc xây dựng các cơ
sở dữ liệu dựa trên Web bắt
đầu được xây dựng. Ban
đầu là với hệ quản trị cơ
sở dữ liệu MS Access hay FoxPro. Sau này,
nhiều công nghệ khác cũng đă du nhập vào
Việt Nam và nhiều Web site được xây
dựng theo hướng này dựa trên nhiều
hệ quản trị cơ sở dữ liệu
khác nhau như Oracle, Microsoft SQL Server, Sybase, Informix, DB2 và
Lotus Domino. Một hai năm trở lại đây, khi
trào lưu sử dụng phần mềm mă
nguồn mở với hệ điều hành Linux
xuất hiện tại Việt Nam th́ xu hướng
này được mở rộng ra cả với
một số hệ quản trị cơ sở
dữ liệu khác như MySQL hoặc PostgreSQL.
Với việc phát triển các ứng dụng Web
dựa trên cho các cơ sở dữ liệu, có
thể thấy rơ có 2 xu hướng chính là sử
dụng công nghệ Active Server Page (hoặc .NET)
của Microsoft với đại diện là các
tệp *.asp (hoặc aspx của .NET) và sử
dụng công nghệ Java của Sun với
đại diện là các tệp *.jsp.
Cho tới nay, phần lớn các Website có
sự kết hợp của cả phần
động – được xây dựng trên cơ
sở các hệ quản trị cơ sở dữ
liệu viết trên công nghệ Web – với các tiêu chí
của cơ sở dữ liệu chỏ tới
phần tĩnh – thường là các tệp siêu văn
bản, ảnh, đa phương tiện –
được lưu trữ trong các cây thư
mục của máy chủ Web.
Để thực hiện việc t́m
kiếm thông tin trên Website, người ta sử
dụng cách t́m kiếm theo trường của
cơ sở dữ liệu kết hợp với
kiểu t́m kiếm toàn văn đối với các
tệp văn bản nằm trong các cây thư
mục của máy chủ Web – thông qua một máy
chủ đánh chỉ số t́m kiếm (như MS
Index Server chẳng hạn).
Có thể
nói, hiện nay tại Việt Nam có hàng chục ngàn
Website đă và đang được xây dựng. V́
vậy, nhu cầu về quản lư nội dung thông
tin trên Website là rất lớn.
Những bất cập
thường thấy
Khi mà
việc xây dựng một Website dù là tĩnh hay
động đă trở nên dễ dàng hơn th́
hầu hết các đơn vị có Website lại
phải đối mặt với một công
việc thường nhật và nặng nhọc –
vấn đề quản trị và cập nhật
nội dung thông tin Website.
Có rất
nhiều các yếu tố chủ quan cũng như
khách quan ảnh hưởng tới chất
lượng nội dung thông tin trên các Website. Bài viết
này chỉ đề cập tới các yếu
tố có liên quan tới vấn đề kỹ
thuật, cụ thể là: Việc quản
trị và cập nhật nội dung thông tin chỉ có
thể thực hiện được trên mạng
LAN.
Không kể tới các Website
tĩnh, ngay cả hầu hết các Website kết
hợp giữa động và tĩnh của chúng ta
được xây dựng th́ phần lớn có
phần mặt tiền (front end) – nơi tiếp xúc
với người sử dụng là dựa trên
nền Web, c̣n phần mặt hậu (back end) –
nơi để thực hiện các công việc
quản trị và cập nhật nội dung
thông tin Website – phần lớn lại không phải là
dựa trên nền Web, mà thường
được viết thành các mẫu (form) nhập
liệu và quản trị, thậm chí phần
quản trị đôi khi là nhờ cậy vào chính các
phần mềm hệ thống và v́ vậy việc
quản trị và cập nhật nội dung thông tin
Website chỉ có thể thực hiện
đựợc trong một hệ thống
mạng LAN giới hạn trong một cơ quan,
một toà nhà, thậm chí thông thường là trong
một hoặc hai pḥng liền kề của bộ
phận chịu trách nhiệm về thông
tin-thường là các trung tâm tin học hoặc trung tâm
thông tin tại các đơn vị, cơ quan của
nhà nước hoặc của các doanh
nghiệp.
Thông tin có tính
cập nhật theo thời gian
kém
Thông tin có tính cập nhật theo thời gian
kém do người cập nhật tin từ xa không
thể tham gia được mà phải chuyển
về trung tâm (thường là thông qua một phần
mềm thứ ba khác như một phần
mềm FTP Client hoặc qua thư điện
thử) rồi trung tâm lấy các thông tin đó từ
máy chủ truyền tệp hoặc máy chủ
thư điện tử, xử lư (đôi khi c̣n
phải chuyển đổi hộ phông chữ cho
người viết) duyệt rồi mới
đưa các thông tin đó lên Website.
Việc cập nhật thông tin lên
Web site gặp khó khăn
Đối với các Website tĩnh, việc
cập nhật thông tin thường gặp khó
khăn khi phải sử dụng tới những
phần mềm trung gian để tạo trang Web và
thực hiện các đường siêu liên kết theo
phương pháp thủ công. Đối với các
Website có kết hợp giữa tĩnh và
động th́ vấn đề trở nên phức
tạp hơn v́ ngoài việc phải cập nhật
các thông tin tĩnh th́ c̣n phải cập nhật các thông
tin động trong các cơ sở dữ liệu và
sau đó phải t́m đúng chỗ để
đặt các tệp siêu văn bản, các tệp
ảnh hoặc đa phương tiện vào
đúng thư mục trên máy chủ Web để
chúng có thể thể hiện trên tŕnh duyệt theo
đúng ư muốn. Công việc này thường
phải nhờ tới những chuyên gia hiểu
biết về công nghệ thông tin thay v́ chỉ sử
dụng những nhân viên nhập liệu b́nh
thường. Khi thiếu các chuyên gia loại này th́ thông
tin sẽ khó có thể được cập
nhật thường xuyên.
Việc loại bỏ thông tin
khỏi Website gặp khó khăn
Khi xây dựng Website, người ta
thường để ư tới việc đưa
thông tin lên Website, ít ai để ư tới việc loại
bỏ thông tin khỏi Website – các thông tin không c̣n giá
trị, hoặc tai hại hơn nữa là các thông tin, v́
lư do nào đó bị sai lệch, cần phải
dỡ ngay khỏi Website. Hăy thử tưởng
tượng người chịu trách nhiệm
về thông tin sẽ làm thế nào khi vào lúc 12 giờ
đêm ở Việt Nam (12 giờ trưa ở
Mỹ), anh ta đi công tác ở tỉnh bạn
hoặc một nước ngoài nào đó và
được báo là có thông tin sai lệch mà anh ta
cần phải ngay lập tức dỡ nó ra
khỏi trang chủ của Website, trong khi việc
quản trị và cập nhật Website lại
chỉ có thể thực hiện được
tại văn pḥng cơ quan của anh ta? Thật là
thảm hoạ! Có lẽ ít tệ hại hơn
nếu là một thông tin mời nộp hồ sơ
đấu thầu vào ngày 10/10 nhưng ngày 11/10 ta
lại vẫn nh́n thấy nó trên Website, mặc dù
điều này cũng thật là khó chịu.
Không có qui tŕnh tự động
cập nhật thông tin lên Website
Hầu hết các Website không có qui tŕnh tự
động cập nhật thông tin lên Website
được thực hiện trên chính ứng
dụng tạo nên Website. V́ vậy nảy sinh mâu
thuẫn thường thấy giữa người
chịu trách nhiệm đưa thông tin lên Website
(thường là lănh đạo của đơn
vị có Website) và người thực hiện
việc đưa thông tin lên Website (thường là nhân
viên tin học của các đơn vị). Những
nơi có qui tŕnh th́ đôi khi các qui tŕnh lại phức
tạp, nhiều khâu kết hợp thủ công
với bán tự động bằng máy nên vẫn
dễ sinh lỗi khi cập nhật thông tin.
Thông tin khó bảo vệ
Khi Website là tĩnh hoặc
là kết hợp giữa động và tĩnh mà
thực tế là các nội dung thông tin của các
tệp thông tin toàn văn – chứa các thông tin quan
trọng nhất của Website – được
lưu giữ trong các cây thư mục của máy
chủ Web th́ việc bảo vệ các thông tin này
được lưu giữ toàn bộ trong cơ
sở dữ liệu.
Thông
tin khó quản trị
Khi
Website là tĩnh hoặc là kết hợp giữa
động và tĩnh th́ việc sao lưu, phục
hồi và đồng bộ hoá dữ liệu
thường gặp khó khăn. Trên thực tế,
khi cần sao lưu, người quản trị
sẽ phải sao lưu cả phần nằm trong
cơ sở dữ liệu lẫn phần nội
dung thông tin các tệp siêu văn bản HTML nằm
trong cây thư mục của máy chủ Web. Khi
cần phục hồi dữ liệu cũng
cần phải phục hồi cả 2 phần này
rồi lại phải đồng bộ chúng
với nhau th́ chúng mới có thể chạy
được, nếu không sẽ sinh lỗi.
Thử tưởng tượng điều ǵ
sẽ xảy ra nếu một khi tên của cây
thư mục hoặc trật tự cây thư
mục chứa các tệp HTML trên máy chủ Web
bị thay đổi. Chắc chắn điều
này sẽ dẫn tới lỗi trên Website và đôi khi
gây nên lỗi hàng loạt.
Hậu quả
Những bất cập thường
thấy ở trên đều là những nguyên nhân
cơ bản tạo nên “cái chết kỹ thuật”
đối với các Web site, nghĩa là Website th́ có, thông
tin th́ không. Hoặc nếu có thông tin th́ đa phần là
các thông tin cũ rích, được tích tụ một
cách “được chăng hay chớ” qua năm
tháng, khó hoặc không thể dọn dẹp
được khi muốn chỉnh lại Website
để có được các thông tin đáng tin
cậy, phù hợp và có tính cập nhật như
mong muốn.
Cách khắc
phục
Một khi
gặp phải những t́nh huống như trên,
điều bạn có lẽ là một hệ
thống quản trị nội dung thông tin
Website.
Các phần mềm loại
này đều là các ứng dụng hoàn toàn chạy
trên nền Web (Web based application) cả ở phần
mặt tiền (front end) lẫn mặt hậu (back
end), nghĩa là cái ǵ cũng là Web. Điều cơ
bản này đảm bảo cho việc quản
trị và cập nhật thông tin được
thực hiện ở bất cứ đâu trên trái
đất này (chứ không phải chỉ hạn
chế trong một hệ thống mạng LAN),
không phụ thuộc vào vị trí địa lư
của người quản trị cũng như
người cập nhật nội dung lên Website,
miễn là có kết nối với Internet và
được phân quyền truy nhập vào hệ
thống ứng dụng.
Các
phần mềm loại này hầu hết
đều dựa trên nguyên tắc là mọi dữ
liệu đều được lưu trữ
trong các hệ quản trị cơ sở dữ
liệu, kể cả các tệp toàn văn, các
tệp toàn ảnh và các tệp đa phương
tiện. Điều này đảm bảo cho
việc bảo vệ, sao lưu, phục hồi và
đồng bộ dữ liệu được
tốt nhất. Với cách này, sẽ không c̣n các
tệp siêu văn bản HTML, các tệp ảnh
*.JPG, *.GIF hay các tệp đa phương tiện
nằm trong cây thư mục của máy chủ Web
nữa v́ tất cả chúng đă được
đưa vào lưu trữ trong cơ sở dữ
liệu. Nói theo cách khác, Website sẽ trở nên
động hoàn toàn. Với các công nghệ hiện
nay, việc t́m kiếm toàn văn đối với
cả các tệp gắn kèm nằm trong cơ
sở dữ liệu đều đă thực
hiện được.
Các
phần mềm loại này được
chạy trên hầu hết các tŕnh duyệt thông
dụng hiện nay như Internet Explorer và Netscape
Communicator.
Trên hết tất cả,
các phần mềm loại này đều tích
hợp qui tŕnh xử lư và quản lư thông tin (cả
đưa lên và cả đưa xuống) của
Website, từ việc viết tin bài, việc duyệt tin
bài và phát hành tin bài của Website đối với các
dạng dữ liệu khác nhau như văn bản,
h́nh ảnh và cả đa phương tiện.
Điều này đảm bảo cho việc
cập nhật và loại bỏ thông tin
được nhanh chóng, chính xác, tạo tiền
đề cho nội dung thông tin trên Website luôn
được tin cậy, phù hợp và có tính cập
nhật như mong muốn.
Các
phần mềm loại này khi chọn phải nên có
tính mở, không phụ thuộc vào các nhà độc
quyền. Với Việt Nam, có thể là các sản
phẩm có khả năng chạy được
cả trên môi trường Windows lẫn trong môi
trường mă nguồn mở với hệ
điều hành Linux.
Cuối cùng,
đối với Việt Nam th́ các phần mềm
loại này phải hỗ trợ đa ngôn ngữ
theo chuẩn Unicode. Được biết, Thủ
tướng Chính phủ đă có quyết
định là từ 01/01/2003 sẽ sử dụng
TCVN 6909:2001 (hỗ trợ Unicode) một cách
thống nhất trong trao đổi các văn
bản điện tử giữa các cơ quan
Đảng và Nhà nước.
Kết luận
Theo Ecomworld.com th́ hiện nay, có rất
nhiều loại sản phẩm quản lư nội
dung trên thị trường. Các sản phẩm này
thực hiện những công việc thích hợp khác
nhau và bạn cần phải nghiên cứu và t́m ra
giải pháp tốt nhất phù hợp với các nhu
cầu của đơn vị bạn.
Cũng theo Ecomworld th́ một giải pháp
quản lư nội dung có thể tốn kém tuỳ
thuộc vào các nhu cầu của bạn, bao gồm
chi phí cho giấy phép phần mềm, đào tạo
và các dịch vụ hỗ trợ, giá cả có
thể từ 200.000 USD tới 2 triệu USD. Có
thể có những giải pháp rẻ tiền hơn,
nhưng những giải pháp chuyên ngành, hỗ
trợ toàn diện th́ sẽ không có mức giá
thấp.
Nếu bạn cho nội
dung thông tin mà bạn hàng ngày cung cấp lên Website là
thứ quí giá gắn liền với nghề
nghiệp và cuộc sống của bạn và
bạn phải duy tŕ để đảm bảo
tính tin cậy, phù hợp và cập nhật của nó
th́ bạn nhất định sẽ cần tới
một qui tŕnh quản lư và cập nhật nội dung
thông tin được xây dựng trên một hệ
thống phần mềm quản lư nội dung thông
tin Website. Trong sự đa dạng của các sản
phẩm loại này, bạn hăy chọn ra cho ḿnh
những ǵ mà bạn cho là phù hợp nhất.
|