বিউটিফুল স্যাুপ (এইচটিএমএল পার্সার)
অবয়ব
মূল উদ্ভাবক | লিওনার্ড রিচার্ডসন |
---|---|
স্থিতিশীল সংস্করণ | ৪.৮.১
/ ৬ অক্টোবর ২০১৯ |
রিপজিটরি | |
যে ভাষায় লিখিত | পাইথন |
প্ল্যাটফর্ম | পাইথন |
ধরন | এইচটিএমএল পার্সার লাইব্রেরি, ওয়েব স্ক্র্যাপিং |
লাইসেন্স | পাইথন সফটওয়্যার ফাউন্ডেশন লাইসেন্স (বিউটিফুল স্যুপ ৩ - পুরোনো একটি সংস্করণ) এমআইটি লাইসেন্স ৪+[১] |
ওয়েবসাইট | www |
বিউটিফুল স্যুপ (ইংরেজি: Beautiful Soup) এইচটিএমএল ও এক্সএমএল ডকুমেন্ট পার্স করার জন্য ব্যবসহৃত একটি পাইথন প্যাকেজ। এটি পার্স ট্রি তৈরী করে, যেটি পরবর্তীতে এইচটিএমএল থেকে ডাটা আলাদা করতে কাজে লাগে। [১]
পাইথন ২.৭ ও ৩ এর জন্য বিউটিফুল স্যুপ ডাউনলোড করা যায়।
কোড উদাহরণ
[সম্পাদনা]#!/usr/bin/python3
# Anchor extraction from html document
from bs4 import BeautifulSoup
from urllib.request import urlopen
with urlopen('https://en.wikipedia.org/wiki/Main_Page') as response:
soup = BeautifulSoup(response, 'html.parser')
for anchor in soup.find_all('a'):
print(anchor.get('href', '/'))
তথ্যসূত্র
[সম্পাদনা]- ↑ ক খ "Beautiful Soup website"। সংগ্রহের তারিখ ১৮ এপ্রিল ২০১২।
Beautiful Soup is licensed under the same terms as Python itself