Thực ra cũng dễ thôi, chả có gì bí ẩn cả
trước tiên mình sẽ đưa cho các bạn 2 hàm dùng để lấy nội dung bằng curl, với 2 hàm này bạn có thể thoải mái dùng mà không cần chỉnh sửa nhiều
hàm get ảnh:
Copy code:
hàm get html:
Copy code:
giờ ta đã có 2 hàm quan trọng rồi, bây giờ việc cần làm là áp dụng nó để phục vụ ae ta
đối với hàm get ảnh bạn dùng như sau:
Copy code:
Copy code:
ok, cơ bản là thế,
đến lượt thằng kia
thằng này đơn giản là nó lấy về source html của wap/web
thôi nói nhanh cho nó vuông là
Copy code:
điều khác nhau cơ bản của 2 hàm trên là lệnh
curl_setopt ($curl, CURLOPT_BINARYTRANSFER, 1);
lệnh này thông báo cho curl biết rằng dữ liệu lấy về là binary, dễ hiểu là nó không phải dạng text, dạng text là những thứ như txt, css, html, xml, xhtml .....
ok, chỉ cần biết thế thôi, nói nữa lại lù tù mù mất
bây giờ mình sẽ lấy 1 tool mình viết sẵn ra để phân tích cho anh em nhá , đây là tool leech của kenh14.vn chuyên mục góc trái tim(cái này mới làm có người hỏi nên nói luôn);
dĩ nhiên là vẫn có 2 hàm trên nhé, sau đây mình thêm một số hàm cần thiết cho việc xử lý nội dung, mình sẻ cố gắng nói kĩ từng hàm cho ae
khi xem 1 link bài viết chẳng hạn http://kenh14.vn/goc-trai-tim/vi-em-nhu-the-day-201354215645186.chn
mình view source nó lên và xem xét thấy có cái này
Copy code:
nó là câu nhấn màu đậm trên bài viết ấy, nó là một phần của bài viết nên mình sẽ tách câu ấy ra bằng hàm sau
Copy code:
xong, phù, mình viết văn kém nên mong ae ráng vậy
// đây là hàm lấy nội dung chính bài viết
//vẫn giống trên thôi mình tìm được nội dung nó nằm trong đoạn từ
//đến
//đến kết thúc
Copy code:
đến hàm này
Copy code:
vậy là mình đả lấy thành công nội dung rồi ha, vấn đề là bây giờ sẻ lấy danh sách các link bài viết trên một trang như thế nào, giả sử ở link http://kenh14.vn/goc-trai-tim/trang-3.chn
mình lại viewsource nó và nhận thấy đoạn mã chứa link luôn có dạng ntn:
Copy code:
?>
như vậy mình sẽ tách lấy mỗi cái link đậm, chính là link bài viết, ok mình có hàm
Copy code:
vậy là đả hết hàm rồi nhỉ, bây giờ đến code điều khiển nhé
Copy code:
vậy là xong rồi đó, test đi,
ở đây mình không dùng hàm get ảnh vì sợ tốn bw các bạn với lại code sẽ load chậm
code hoàn chỉnh
Copy code:
tool leech by princenuce
#is',$data,$h2);
return($h2[1">[0">);
}
function get_h1 ($data){
preg_match_all0#is',$data,$h1);
return($h1[1">[0">);
}
function get_div ($data){
preg_match_all0