Files
crewAI/docs/ar/tools/web-scraping/oxylabsscraperstool.mdx

237 lines
7.9 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: أدوات استخراج Oxylabs
description: >
تتيح أدوات استخراج Oxylabs الوصول بسهولة إلى المعلومات من المصادر المعنية. يرجى الاطلاع على قائمة المصادر المتاحة أدناه:
- `Amazon Product`
- `Amazon Search`
- `Google Seach`
- `Universal`
icon: globe
mode: "wide"
---
## التثبيت
احصل على بيانات الاعتماد بإنشاء حساب Oxylabs [هنا](https://oxylabs.io).
```shell
pip install 'crewai[tools]' oxylabs
```
راجع [توثيق Oxylabs](https://developers.oxylabs.io/scraping-solutions/web-scraper-api/targets) للحصول على مزيد من المعلومات حول معاملات API.
# `OxylabsAmazonProductScraperTool`
### مثال
```python
from crewai_tools import OxylabsAmazonProductScraperTool
# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsAmazonProductScraperTool()
result = tool.run(query="AAAAABBBBCC")
print(result)
```
### المعاملات
- `query` - رمز ASIN المكون من 10 رموز.
- `domain` - توطين النطاق لـ Amazon.
- `geo_location` - موقع _التوصيل إلى_.
- `user_agent_type` - نوع الجهاز والمتصفح.
- `render` - يفعّل تصيير JavaScript عند التعيين إلى `html`.
- `callback_url` - عنوان URL لنقطة نهاية الاستدعاء الخاصة بك.
- `context` - إعدادات وضوابط متقدمة إضافية للمتطلبات المتخصصة.
- `parse` - يُرجع بيانات مُحلّلة عند التعيين إلى true.
- `parsing_instructions` - حدد منطق التحليل وتحويل البيانات الخاص بك الذي سيُنفّذ على نتيجة استخراج HTML.
### مثال متقدم
```python
from crewai_tools import OxylabsAmazonProductScraperTool
# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsAmazonProductScraperTool(
config={
"domain": "com",
"parse": True,
"context": [
{
"key": "autoselect_variant",
"value": True
}
]
}
)
result = tool.run(query="AAAAABBBBCC")
print(result)
```
# `OxylabsAmazonSearchScraperTool`
### مثال
```python
from crewai_tools import OxylabsAmazonSearchScraperTool
# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsAmazonSearchScraperTool()
result = tool.run(query="headsets")
print(result)
```
### المعاملات
- `query` - مصطلح بحث Amazon.
- `domain` - توطين النطاق لـ Bestbuy.
- `start_page` - رقم صفحة البداية.
- `pages` - عدد الصفحات المراد استرجاعها.
- `geo_location` - موقع _التوصيل إلى_.
- `user_agent_type` - نوع الجهاز والمتصفح.
- `render` - يفعّل تصيير JavaScript عند التعيين إلى `html`.
- `callback_url` - عنوان URL لنقطة نهاية الاستدعاء الخاصة بك.
- `context` - إعدادات وضوابط متقدمة إضافية للمتطلبات المتخصصة.
- `parse` - يُرجع بيانات مُحلّلة عند التعيين إلى true.
- `parsing_instructions` - حدد منطق التحليل وتحويل البيانات الخاص بك الذي سيُنفّذ على نتيجة استخراج HTML.
### مثال متقدم
```python
from crewai_tools import OxylabsAmazonSearchScraperTool
# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsAmazonSearchScraperTool(
config={
"domain": 'nl',
"start_page": 2,
"pages": 2,
"parse": True,
"context": [
{'key': 'category_id', 'value': 16391693031}
],
}
)
result = tool.run(query='nirvana tshirt')
print(result)
```
# `OxylabsGoogleSearchScraperTool`
### مثال
```python
from crewai_tools import OxylabsGoogleSearchScraperTool
# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsGoogleSearchScraperTool()
result = tool.run(query="iPhone 16")
print(result)
```
### المعاملات
- `query` - كلمة البحث المفتاحية.
- `domain` - توطين النطاق لـ Google.
- `start_page` - رقم صفحة البداية.
- `pages` - عدد الصفحات المراد استرجاعها.
- `limit` - عدد النتائج المراد استرجاعها في كل صفحة.
- `locale` - قيمة رأس `Accept-Language` التي تغيّر لغة واجهة صفحة بحث Google.
- `geo_location` - الموقع الجغرافي الذي يجب تكييف النتيجة له. استخدام هذا المعامل بشكل صحيح مهم للغاية للحصول على البيانات الصحيحة.
- `user_agent_type` - نوع الجهاز والمتصفح.
- `render` - يفعّل تصيير JavaScript عند التعيين إلى `html`.
- `callback_url` - عنوان URL لنقطة نهاية الاستدعاء الخاصة بك.
- `context` - إعدادات وضوابط متقدمة إضافية للمتطلبات المتخصصة.
- `parse` - يُرجع بيانات مُحلّلة عند التعيين إلى true.
- `parsing_instructions` - حدد منطق التحليل وتحويل البيانات الخاص بك الذي سيُنفّذ على نتيجة استخراج HTML.
### مثال متقدم
```python
from crewai_tools import OxylabsGoogleSearchScraperTool
# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsGoogleSearchScraperTool(
config={
"parse": True,
"geo_location": "Paris, France",
"user_agent_type": "tablet",
}
)
result = tool.run(query="iPhone 16")
print(result)
```
# `OxylabsUniversalScraperTool`
### مثال
```python
from crewai_tools import OxylabsUniversalScraperTool
# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsUniversalScraperTool()
result = tool.run(url="https://ip.oxylabs.io")
print(result)
```
### المعاملات
- `url` - عنوان URL للموقع المراد استخراجه.
- `user_agent_type` - نوع الجهاز والمتصفح.
- `geo_location` - يعيّن الموقع الجغرافي للبروكسي لاسترجاع البيانات.
- `render` - يفعّل تصيير JavaScript عند التعيين إلى `html`.
- `callback_url` - عنوان URL لنقطة نهاية الاستدعاء الخاصة بك.
- `context` - إعدادات وضوابط متقدمة إضافية للمتطلبات المتخصصة.
- `parse` - يُرجع بيانات مُحلّلة عند التعيين إلى `true`، طالما يوجد مُحلّل مخصص لنوع صفحة عنوان URL المقدم.
- `parsing_instructions` - حدد منطق التحليل وتحويل البيانات الخاص بك الذي سيُنفّذ على نتيجة استخراج HTML.
### مثال متقدم
```python
from crewai_tools import OxylabsUniversalScraperTool
# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsUniversalScraperTool(
config={
"render": "html",
"user_agent_type": "mobile",
"context": [
{"key": "force_headers", "value": True},
{"key": "force_cookies", "value": True},
{
"key": "headers",
"value": {
"Custom-Header-Name": "custom header content",
},
},
{
"key": "cookies",
"value": [
{"key": "NID", "value": "1234567890"},
{"key": "1P JAR", "value": "0987654321"},
],
},
{"key": "http_method", "value": "get"},
{"key": "follow_redirects", "value": True},
{"key": "successful_status_codes", "value": [808, 909]},
],
}
)
result = tool.run(url="https://ip.oxylabs.io")
print(result)
```