Bạn thường xuyên mất nhiều thời gian để tìm kiếm lục lại mớ tài liệu file đã lưu trữ mà không thể nhớ được là mình đã lưu chúng ở đâu?
Bạn thường xuyên bực bội vì không thể tìm được file bằng các từ khoá gợi nhớ, hoặc công cụ tìm kiếm thực thi việc tìm kiếm quá lâu?
Bạn phải sử dụng tính năng Advance Seach để đọc và tìm metadata keyword trong các file tài liệu đã từng đọc hay làm việc?
Bạn bực bội vì khi mở và lưu file đường dẫn hay gặp trục trặc mà không rõ lý do?
Trước sự bùng nổ của thông tin mang lại cho con người một kho tài nguyên tri thức có thể tiếp cận và sử dụng bất kỳ lúc nào, hay bất kỳ ở đâu. Tuy nhiên, việc chọn lọc lưu trữ lại các dữ liệu và thông tin cần thiết gặp nhiều khó khăn, đặc biệt là công việc và kỹ năng tìm kiếm liên quan nhiều tới tư duy lưu trữ và tìm kiếm dữ liệu của bạn. Theo một số các đánh giá, thì hiệu suất làm việc của người lao động cũng bị ảnh hưởng khá nhiều bởi kỹ năng tìm kiếm, và tiêu tốn nhiều thời gian cho việc tìm kiếm (search) và lọc (filter) file dữ liệu. Hiệu suất thời gian làm việc có thể giảm tới 30-50% cho các thao tác như vậy hằng ngày mà đôi khi bạn khó nhận ra vì thói quen làm việc? Vậy vấn đề chính nằm ở đâu?
Bài viết này nhằm mục đích chia sẻ để bạn có thể hiểu được cách thức mà bộ nhớ máy tính lưu trữ, các phương pháp tối ưu việc lưu trữ tìm kiếm và lọc thông tin khi cần thiết.
Những kỹ năng đơn giản này đôi khi sẽ cải thiện đáng kể hiệu quả thời gian làm việc của bạn cho cho việc tìm kiếm và lọc dữ liệu, bạn sẽ có nhiều thời gian cho các công việc trí óc khác và giảm căng thẳng bực bội vì những việc không có nhiều ý nghĩa này. Nào chúng ta hãy bắt đầu khám phá nhé.
Nguyên lý lưu trữ dữ liệu trên ổ cứng/ thư mục của bạn
Để hiểu rõ được tại sao bạn cần phải thực hiện các phương pháp đặt tên và tối ưu lưu trữ, bạn cần hiểu rõ cách mà một file được lưu trữ xuống ổ đĩa hay thư mục của bạn như thế nào? Cho dù bạn sử dụng phương pháp lưu trữ trên ổ cứng máy tính cá nhân, ổ lưu trữ ngoài hay các dịch vụ Cloud services…. Thì chúng cũng đều hoạt động trên cùng một nguyên tắc.
Khi bạn lưu trữ một file tài liệu (word, excel, power point, pdf …) vào thư mục thì thực ra máy tính của bạn đang thực hiện lưu trữ bao gồm 02 phần thông tin: thông tin chỉ mục và phần nội dung file tài liệu.
Nếu bạn đã từng đọc sách ở thư viện thì phần chỉ mục giống như bạn đi tìm tên và mô tả sách ở tủ tra cứu được sắp xếp theo thứ tự chữ cái từ A-Z, còn kho lưu trữ sách thật sự nằm ở gian phòng phía sau với các số hiệu tủ, và mã hiệu ngăn kệ để người quản thư có thể dễ dàng đi thẳng tới chỗ kệ sách trong kho mà mang ra cho bạn.
- Nơi lưu thông tin chỉ mục (Directory table/ Index): sẽ lưu trữ tên file, định dạng file, đường dẫn file, và địa chỉ lưu trữ trên ổ cứng.
- Nơi lưu nội dung file tài liệu (Data Store): Vùng lưu trữ dữ liệu file thật sự có thể nằm rải rác ngẫu nhiên hoặc xen kẽ giữa các vùng đĩa trống của ổ cứng chứ không liên tục như bạn nghĩ.
Đối với các loại ổ cứng cơ truyền thống HDD thì cấu trúc này ảnh hưởng khá nhiều tới hiệu suất tìm kiếm hay đọc file với content bên trong, vì mỗi lần file được tìm kiếm hay đọc thì ổ cứng phải di chuyển đầu đọc đến các vùng vành đai khác nhau của ổ cứng để đọc lên những phần (part) dữ liệu của file – bạn lưu ý là một file có thể được chia thành nhiều phần lưu trữ ở các vùng nhớ khác nhau chứ không liên tục trên ổ cứng của bạn.
Với ổ cứng SSD thì vùng nhớ được tổ chức dưới dạng các địa chỉ ma trận trên Chip nhớ nên dễ dàng và nhanh chóng đọc phản hồi ngay dữ liệu mà bạn cần, đối với các ổ cứng SSD chỉ gặp phải giới hạn ở hiệu năng đọc ghi liên quan tới 2 tham số băng thông và số lượng đọc ghi đồng thời.
Như vậy, khi lượng file dữ liệu trên thư mục hay ổ cứng của bạn càng lớn thì hiệu năng truy xuất càng giảm, và số lượng file trong thư mục hay ổ đĩa càng nhiều thì hiệu năng truy xuất
Định dạng bảng chỉ mục và Cách thức dữ liệu được tìm kiếm trên bộ nhớ.
Định dạng và giới hạn của địa chỉ đường dẫn chỉ mục.
Đối với ổ cứng định dạng NTFS trên máy tính Windows thì sử dụng bảng mã Unicode có các ngưỡng giới hạn sau về chiều dài tên file, tên một thư mục và tổng chiều dài đường dẫn như sau:
- Giới hạn tối đa của tên file là 255 ký tự
- Giới hạn tối đa của tên 1 thư mục là 260 ký tự
(mặc định với win10/ server 2016 hoặc các windows cũ hơn – max_path) - Chiều dài tối đa của 1 đường dẫn là 32,767 ký tự.
Vấn đề với chiều dài đường dẫn lưu trữ/ tên file.
Chúng ta có thể đọc được dễ dàng tên file bằng và thư mục có dấu hoặc không dấu, tuy nhiên đối với máy tính chỉ hiểu và biên dịch tên file dưới dạng bảng mã ký tự Unicode thông thường phức tạp như “ADFC24”.
Khi bạn lưu các tên file/ đường dẫn bằng tên Tiếng việt (sử dụng bảng mã utf-8) thì đều được chuyển ngữ thành 02 ký tự Unicode. Như vậy, một file/đường dẫn được đặt tên bằng ký tự có dấu sẽ có chiều dài lưu trữ gấp đôi so với tên không dấu. Việc lưu trữ tên file và thư mục quá dài sẽ làm giảm hiệu suất và thời gian tìm kiếm của bạn. Khi đường dẫn lưu trữ file tới giới hạn tối đa của đường dẫn thư mục, và bạn sẽ không thể tìm kiếm được file, sao lưu hoặc copy thiếu các file / thư mục có đường dẫn quá dài. Như vậy đặc biệt trong doanh nghiệp bộ phận IT sẽ không thể hỗ trợ bạn backup toàn vẹn phần dữ liệu này thường xuyên được. D:\very long path\\?\
Các yếu tố sử dụng nào ảnh hưởng tới hiệu quả tìm kiếm và truy xuất dữ liệu của bạn?
Tên tệp quá dài
Tên tệp quá dài không hoạt động tốt với hầu hết các phần mềm, và ảnh hưởng nhiều tới hiệu năng tìm kiếm, copy, backup …
Tên tệp quá vắn tắt
Với một tên tệp quá vắn tắt bạn khó có thể tìm kiếm hoặc hiểu được nội dung mục đích bên trong của file.
Tên tệp với các chuỗi ký tự không có ý nghĩa
Tên tệp được tạo ra từ các website hay phần mềm thường có cách đặt tên mã hoá định danh tên theo quy tắc của phần mềm / website mà bạn tải xuống, khi bạn lưu trữ các tài liệu này thì cũng nên thiết đặt lại tên tài liệu và lựa chọn đường dẫn lưu trữ hợp lý.
Tệp không lưu trữ thành các phiên bản
Việc lưu trữ file không sắp xếp thành các phiên bản có thể làm bạn phải mất nhiều thời gian kiểm tra so chiếu thông tin ngày giờ tạo … để biết được đâu là tài liệu bản chính sau cùng hay các thay đổi nào trong quá trình lưu trữ hoặc dễ nhầm lẫn lưu đè dữ liệu không mong muốn.
Tên tệp có chứa các ký tự đặc biệt
Bạn tuyệt đối không nên đặt tên file / thư mục bằng các ký tự đặc biệt như: [ ~! @ # $% ^ & * () `; <>? , [] {} ‘” hay | ], các ký tự đặc khó có thể nhận diện hoặc đọc được bởi hầu hết các phần mềm.
Hạn chế sử dụng các dấu cách
Bạn nên hạn chế sử dụng dấu cách để đặt tên tệp cho một số loại phần mềm có thể không nhận dạng hoặc nhận dạng tên sai, đối với các loại file server hay ổ cloud drive thì đã được hỗ trợ tốt nên bạn có thể thoải mái đặt tên file/ thư mục có dấu cách nhé.
Tài liệu thường xuyên được tải mặc định xuống thư mục “Download” hay “My Document”
Đây là 02 thư mục phục vụ cho công việc lưu trữ và đọc nhanh các tài liệu được tải xuống tạm hoặc đọc qua rồi xoá. Việc lưu quá nhiều file tài liệu trong các thư mục mặc định này có thể nhanh chóng làm đầy ổ C:\ cũng là tác nhân làm máy tính xử lý chậm hơn.
Các phương pháp và quy tắc lưu trữ file tài liệu bạn có thể tham khảo?
Việc bạn duy trì một thói quen cho cách quy định đặt tên tài liệu được lưu trữ ngay từ đầu rất quan trọng và ảnh hưởng nhiều tới hiệu quả tìm kiếm tài liệu về sau. Việc chú ý tới sắp xếp và tổ chức lưu trữ tài liệu ngay từ đầu có thể giúp bạn tìm kiếm lại các tài liệu một cách nhanh chóng và dễ dàng về sau.
Bạn có thể thiết lập một cấu trúc thư mục rõ ràng và có trật tự như tên dự án, chủ đề, thể loại, ngày tháng năm, trạng thái hoặc phiên bản của tài liệu … giúp bạn có thể gợi nhớ về các loại từ khoá hoặc lọc dữ liệu (short), kiểm tra sự thay đổi, xác định loại tài liệu sau cùng …
Các phương pháp đặt tên cho file tài liệu
Các yếu tố bạn có thể dùng để đặt tên file hoặc tiếp đầu ngữ bao gồm:
- Theo loại tài liệu như Contract, Project, PO, Quote, Estimate, Dealer, PriceList, Waranty…
- Theo chức năng của tài liệu: Brochure, Planning, Checklist, implement, Guideline, Meeting Note Template….
- Theo thể loại / dòng phẩm: Furniture, hardware, software,
- Theo tên khách hàng / đối tác:
- Từ đơn vị của bạn gửi đến khách hàng: <tên cty bạn vắn tắt>_<tên công ty đối tác/ khách hàng vắn tắt>
- Form hoặc tài liệu từ nhà cung cấp/ đối tác: <tên công ty đối tác/ khách hàng vắn tắt>_<tên cty bạn vắn tắt>
- Theo mã hồ sơ, mã tài liệu, ngày tháng năm: YYYYMMDD: Cách này giúp bạn có thể quản lý các phiên bản thay đổi của tài liệu được cập nhật theo ngày hoặc có thể tìm kiếm hoặc lọc (short) dữ liệu và tìm ra thời gian và phiên bản tài liệu sau cùng một cách nhanh chóng.
- Cách đặt tên theo ngày/tháng/năm bạn còn có thể kết hợp với các từ trạng thái như _draff, _update, _revise, _approve, _final,… để xác định trạng thái của tài liệu khi được lưu chuyển trình duyệt giữa các bộ phận hay các cấp quản lý
- Sử dụng các số thứ tự theo định dạng 01, 001 thay vì 1,2,….10, 11, …100,101
Cách phân loại và đặt tên cho các thư mục chính:
Đầu tiên thường nhất là bạn vẫn phân loại theo bộ phận hoặc phòng ban, cách này giúp bạn có thể dễ dàng phân loại, phân quyền và chia sẻ dữ liệu một cách dễ dàng và tránh gửi các thông tin cho bộ phận hoặc cá nhân không phù hợp.
Kế đến là các thư mục phân loại theo chức năng/ hoạt động công việc như Design, Planning, Quotation, Contract, Delivery, Report, Trainnning,
Hoặc phân loại các tài liệu theo tên khách hàng (Customer), tên dự án (Project), hay bán hàng
Kế đến là sử dụng các số thứ tự 01, 001 … cho tài liệu hoặc thư mục, giúp bạn định vị được mức độ ưu tiên kiểm tra thứ tự số lượng tài liệu theo quy trình … cũng giúp cho các thư mục hay file quan trọng luôn được sắp xếp (sort) ở vị trí đầu tiên của thư mục khi được mở.
Đặc biệt các thư mục thuộc loại hình ảnh hoặc video cũng cần được lưu trữ ở một thư mục riêng, các file hình ảnh thường làm dữ liệu phân mảnh, ứng dụng explorer của windows luôn cố gắng để đọc hiển thị preview hình ảnh / video làm cho việc truy xuất và tìm kiếm lâu hơn. Hơn nữa, các file video thường chứa dung lượng lớn hoặc không cần thiết sao lưu thường xuyên có thể ảnh hưởng nhiều tới hiệu suất và thời gian khi bạn thực hiện các thao tác lọc, phân loại, copy, lưu trữ, backup dữ liệu của bạn trong các thư mục.
Việc sau cùng đó là bạn nên Archiving dữ liệu: sau một thời gian bạn lưu trữ và đặt tên quá nhiều tài liệu hoặc dữ liệu, một số tài liệu hay phiên bản quan trọng, thường xuyên sử dụng, lại nằm xen lẫn với các loại tài liệu không quan trọng bằng nhưng chúng dễ dàng làm bạn lẫn lộn, nhưng bạn lại không thể hoặc không muốn xoá chúng. Bạn hãy tạo riêng 1 thư mục Archiving và di chuyển hết toàn bộ các tài liệu thứ yếu không quan trọng này vào đấy để có thể xem hoặc truy cứu lại khi cần thiết.
Case Study & Example
Sau đây là cách yếu tố lưu trữ và đặt tên bạn cần chú ý, và tham khảo để thiết lập một cách khoa học.
- Tên hoặc từ viết tắt của dự án
- Số hiệu tài liệu (theo số văn bản nếu có)
- Ngày thực hiện tài liệu
- Loại, ví trí, chức năng của tài liệu
- Tên mô tả ngắn gọn nội dung tài liệu
- Số hiệu phiên bản, hoặc trạng thái tài liệu (nếu cần)
Các cấu trúc lưu trữ tham khảo như:
<YYYYMMDD_VIẾT TẮT TỔ CHỨC_VIẾT TẮT LOẠI TÀI LIỆU_MÔ TẢ GỢI NHỚ_ PHIÊN BẢN>
Ví dụ: 20210610_CCVI_Propose_Ha tang trung tam du lieu_revised
<TÊN VIẾT TẮT KHÁCH HÀNG_LOẠI TÀI LIỆU_MÔ TẢ GỢI NHỚ_PHIÊN BẢN_DDMMYYYY>
Ví dụ: HoangDieu_BanVe_ThietKeNha_v2_11072021
Cấu trúc thư mục tổ chức tham khảo:
Ví dụ:
Bạn cần tư vấn các vấn đề về giải pháp tổ chức hệ thống File Server, Cloud Drive Services … hãy liên hệ chúng tôi để được hỗ trợ và tư vấn
Hãy liên hệ (contact@ccvi.vn ) chúng tôi hoặc điện thoại (0902355580) để được chuyên gia của chúng tôi hỗ trợ tư vấn lựa chọn sản phẩm phù hợp.
- Hỗ trợ miễn phí:
- Tư vấn lựa chọn giải pháp lưu trữ chia sẻ phù hợp.
- Tư vấn và hỗ trợ tổ chức cấu trúc và phân quyền chia sẻ dữ liệu trong doanh nghiệp.
— o —