বিষয়বস্তুতে চলুন

বিউটিফুল স্যাুপ (এইচটিএমএল পার্সার)

উইকিপিডিয়া, মুক্ত বিশ্বকোষ থেকে

বিউটিফুল স্যাুপ
মূল উদ্ভাবকলিওনার্ড রিচার্ডসন
স্থিতিশীল সংস্করণ
৪.৮.১ / ৬ অক্টোবর ২০১৯; ৫ বছর আগে (2019-10-06)
রিপজিটরি উইকিউপাত্তে এটি সম্পাদনা করুন
যে ভাষায় লিখিতপাইথন
প্ল্যাটফর্মপাইথন
ধরনএইচটিএমএল পার্সার লাইব্রেরি, ওয়েব স্ক্র্যাপিং
লাইসেন্সপাইথন সফটওয়্যার ফাউন্ডেশন লাইসেন্স (বিউটিফুল স্যুপ ৩ - পুরোনো একটি সংস্করণ) এমআইটি লাইসেন্স ৪+[]
ওয়েবসাইটwww.crummy.com/software/BeautifulSoup/

বিউটিফুল স্যুপ (ইংরেজি: Beautiful Soup) এইচটিএমএল ও এক্সএমএল ডকুমেন্ট পার্স করার জন্য ব্যবসহৃত একটি পাইথন প্যাকেজ। এটি পার্স ট্রি তৈরী করে, যেটি পরবর্তীতে এইচটিএমএল থেকে ডাটা আলাদা করতে কাজে লাগে। []

পাইথন ২.৭ ও ৩ এর জন্য বিউটিফুল স্যুপ ডাউনলোড করা যায়।

কোড উদাহরণ

[সম্পাদনা]
#!/usr/bin/python3
# Anchor extraction from html document
from bs4 import BeautifulSoup
from urllib.request import urlopen

with urlopen('https://en.wikipedia.org/wiki/Main_Page') as response:
    soup = BeautifulSoup(response, 'html.parser')
    for anchor in soup.find_all('a'):
        print(anchor.get('href', '/'))

তথ্যসূত্র

[সম্পাদনা]
  1. "Beautiful Soup website"। সংগ্রহের তারিখ ১৮ এপ্রিল ২০১২Beautiful Soup is licensed under the same terms as Python itself