Bootstrap trong ngôn ngữ Python
- Khả Nhi Lê Ngọc
- Jul 30, 2020
- 1 min read
Trong bài này, Nhi sẽ hướng dẫn các bạn thực hiện một quy trình chọn mẫu ngẫu nhiên lặp lại (hay Bootstrap) hoàn toàn thủ công trong ngôn ngữ Python.
Một quy trình bootstrap sẽ có cấu trúc như sau:
(1) Một place-holder để thu nhận kết quả sinh ra từ vòng lặp tái chọn mẫu. Placeholder là 1 data object, có cấu trúc tùy theo nhu cầu về kết quả mà ta mong muốn. Ta có thể dùng list, dictionary, numpy array hoặc pandas dataframes.
(2) Pseudo-random value generator: Một cơ chế để sinh ra giá trị ngẫu nhiên; thông thường ta dùng các method random của python hay của module numpy.random, thí dụ randint hay random.choice, để thực hiện việc chọn mẫu ngẫu nhiên.
(3) Quy trình (hàm) để ước tính một hay nhiều giá trị mà ta mong muốn trên mẫu dữ liệu sinh ra từ (2)
(4) Một vòng lặp, để lặp lại n lần bước (2) và (3), và mỗi lần như vậy gán dữ liệu từ (3) vào place holder (1)
Comments