Major updates: - December 2025 crisis documentation and separation agreement - Daily check system v2 with multiple card categories - Xiaozhu rental search tools and results - Exit plan documentation - Message drafts for family communication - Confluent moved to CONSTANT - Updated profiles and promises 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
183 lines
5.1 KiB
Markdown
183 lines
5.1 KiB
Markdown
# Xiaozhu Minsu Scraper - Location Client Interface
|
||
|
||
Scraper pour `https://minsu.xiaozhu.com/` (interface client, pas landlord).
|
||
|
||
**Style:** Airbnb-like, apparts de particuliers ✨
|
||
|
||
## Critères configurés
|
||
|
||
- 📅 **Dates:** 24 déc 2025 → 22 jan 2026 (29 jours)
|
||
- 📍 **Zone:** Xujiahui District (徐汇区), près de Jiaotong University
|
||
- 💰 **Budget:** 3000-5000 RMB/mois (= ~2900-4833 RMB pour 29 jours)
|
||
- ✅ **Must-have:** Cuisine (厨房) + Frigo (冰箱)
|
||
- 🎁 **Nice-to-have:** Machine à laver (洗衣机), Métro (地铁)
|
||
|
||
## Setup - Extraction cookies Firefox
|
||
|
||
### Méthode 1 : Avec extension (RECOMMANDÉ - 30 sec)
|
||
|
||
1. **Installe** [Cookie-Editor](https://addons.mozilla.org/firefox/addon/cookie-editor/) (extension Firefox)
|
||
2. **Va sur** https://minsu.xiaozhu.com/ dans Firefox
|
||
3. **Login** si nécessaire
|
||
4. **Click** icône Cookie-Editor → **Export** → **Copy all as JSON**
|
||
5. **Edit** `firefox_cookie_converter.js` :
|
||
```javascript
|
||
const cookiesJSON = [PASTE_YOUR_JSON_HERE];
|
||
```
|
||
6. **Run:**
|
||
```bash
|
||
node firefox_cookie_converter.js
|
||
```
|
||
|
||
### Méthode 2 : Manuel (2 min)
|
||
|
||
1. **Firefox** → `https://minsu.xiaozhu.com/`
|
||
2. **F12** → Onglet **Storage** (Stockage)
|
||
3. **Cookies** → `https://minsu.xiaozhu.com`
|
||
4. **Select all** (Ctrl+A) → **Right click** → **Copy**
|
||
5. **Edit** `firefox_cookie_converter.js` :
|
||
```javascript
|
||
const cookiesDevTools = `
|
||
[PASTE_YOUR_COOKIES_HERE]
|
||
`;
|
||
```
|
||
6. **Run:**
|
||
```bash
|
||
node firefox_cookie_converter.js
|
||
```
|
||
|
||
### Output
|
||
|
||
✅ Génère `xiaozhu_cookies.json` (format Puppeteer)
|
||
|
||
## Run le scraper
|
||
|
||
```bash
|
||
node xiaozhu_minsu_scraper.js
|
||
```
|
||
|
||
**Ce qui se passe:**
|
||
|
||
1. ✅ Charge tes cookies (si dispos)
|
||
2. 🔍 Essaie plusieurs URLs de recherche
|
||
3. 📝 Cherche input de recherche pour "上海 徐汇区"
|
||
4. 📊 Extrait toutes les annonces
|
||
5. 🎯 Filtre selon critères (budget, équipements)
|
||
6. ⭐ Score chaque appart (prix + équipements + localisation)
|
||
7. 💾 Génère 2 fichiers :
|
||
- `xiaozhu_minsu_results.json`
|
||
- `xiaozhu_minsu_results.md`
|
||
8. 📸 Screenshots : `xiaozhu_minsu_page.png`, `xiaozhu_minsu_final.png`
|
||
|
||
## Scoring
|
||
|
||
**Formule (plus haut = mieux) :**
|
||
|
||
- **Prix ≤ idéal (4000/mois):** +bonus
|
||
- **Prix > idéal:** Petit malus
|
||
- **Cuisine:** +20 pts (required)
|
||
- **Frigo:** +15 pts (required)
|
||
- **Machine à laver:** +10 pts
|
||
- **Métro:** +15 pts
|
||
- **Dans Xujiahui District:** +20 pts
|
||
- **Mention "交通大学":** +10 pts
|
||
|
||
## Output Markdown
|
||
|
||
Tableau format:
|
||
|
||
| # | Title | Daily | Total | Kitchen | Fridge | Washer | Metro | Score | Link |
|
||
|---|-------|-------|-------|---------|--------|--------|-------|-------|------|
|
||
| 1 | 温馨一居室... | ¥120 | ¥3480 | ✓ | ✓ | ✓ | ✓ | 85.2 | [View](...) |
|
||
|
||
## Troubleshooting
|
||
|
||
### "No cookies found"
|
||
|
||
→ Run `firefox_cookie_converter.js` d'abord
|
||
|
||
### Page structure différente
|
||
|
||
→ Check `xiaozhu_minsu_page.html` sauvegardé pour inspecter la structure
|
||
→ Les sélecteurs CSS peuvent nécessiter mise à jour ligne 140-180 du scraper
|
||
|
||
### Aucun résultat
|
||
|
||
**Possible causes:**
|
||
|
||
1. Site nécessite login (cookies invalides/expirés)
|
||
2. URL de recherche incorrecte (le scraper teste plusieurs patterns)
|
||
3. Structure HTML a changé (inspecter screenshots)
|
||
|
||
**Solutions:**
|
||
|
||
1. Re-extract les cookies (méthode 1 ou 2)
|
||
2. Ouvre `minsu.xiaozhu.com` manuellement, note l'URL correcte de recherche Shanghai
|
||
3. Update les `searchUrls` dans le scraper ligne 77-82
|
||
|
||
## Next Steps après résultats
|
||
|
||
**Quand tu as les TOP résultats:**
|
||
|
||
1. ✅ Ouvre les URLs dans Firefox
|
||
2. 📸 Check photos, reviews
|
||
3. 📝 Lit description complète
|
||
4. 📞 Contact propriétaires (questions en chinois ci-dessous)
|
||
|
||
### Questions propriétaire (Copier-coller WeChat)
|
||
|
||
```
|
||
你好!我对你的房源很感兴趣。
|
||
|
||
入住日期:12月24日 - 1月22日(29天)
|
||
有几个问题想确认一下:
|
||
|
||
1. 这个价格是每天的价格吗?29天一共多少钱?
|
||
(This price is per day? How much for 29 days total?)
|
||
|
||
2. 押金多少?
|
||
(How much deposit?)
|
||
|
||
3. 包水电煤吗?
|
||
(Utilities included?)
|
||
|
||
4. 有厨房和冰箱吗?
|
||
(Has kitchen and fridge?)
|
||
|
||
5. 有洗衣机吗?
|
||
(Has washing machine?)
|
||
|
||
6. 离交通大学地铁站多远?
|
||
(How far from Jiaotong University metro?)
|
||
|
||
7. 可以签合同吗?
|
||
(Can we sign a contract?)
|
||
|
||
8. 什么时候可以看房?
|
||
(When can I view the apartment?)
|
||
|
||
谢谢!
|
||
```
|
||
|
||
## Files générés
|
||
|
||
```
|
||
tools/
|
||
├── firefox_cookie_converter.js # Convertisseur cookies
|
||
├── xiaozhu_minsu_scraper.js # Scraper principal
|
||
├── xiaozhu_cookies.json # Cookies convertis (auto-généré)
|
||
├── xiaozhu_minsu_results.json # Résultats JSON (auto-généré)
|
||
├── xiaozhu_minsu_results.md # Tableau lisible (auto-généré)
|
||
├── xiaozhu_minsu_page.png # Screenshot page (auto-généré)
|
||
├── xiaozhu_minsu_final.png # Screenshot final (auto-généré)
|
||
└── XIAOZHU_MINSU_README.md # Ce fichier
|
||
```
|
||
|
||
---
|
||
|
||
**Xiaozhu vs Ziroom:**
|
||
- ✅ **Xiaozhu:** Airbnb-like, apparts persos, chaleureux, flexible
|
||
- ❌ **Ziroom:** Corporate, standardisé, contrats longs
|
||
|
||
**T'as fait le bon choix** 😎
|