Allow input of arbitraty page name

Document receiver will check for 404 error if page is invalid. If page is valid just scrape it as if it was the full uri. closes #34
2025-06-05 23:29:13 +02:00 · 2021-08-10 14:46:44 +02:00
parent b4d37fbc3f
commit 7fdfd38cdc
4 changed files with 55 additions and 39 deletions
--- a/app/src/main/java/com/akdev/nofbeventscraper/DocumentReceiver.java
+++ b/app/src/main/java/com/akdev/nofbeventscraper/DocumentReceiver.java
@@ -3,19 +3,22 @@ package com.akdev.nofbeventscraper;
 import android.util.Log;

 import org.jsoup.Connection;
+import org.jsoup.HttpStatusException;
 import org.jsoup.Jsoup;
+import org.jsoup.nodes.Document;
 import org.jsoup.nodes.Element;
+
+import java.io.IOException;
 import java.util.HashMap;
 import java.util.List;
 import java.util.Map;

 public class DocumentReceiver {

-    public static org.jsoup.nodes.Document getDocument(String url) {
+    public static org.jsoup.nodes.Document getDocument(String url) throws HttpStatusException, IOException {

        org.jsoup.nodes.Document document;

-        try {
        // use default android user agent
        String user_agent = "Mozilla/5.0 (X11; Linux x86_64)";

@@ -51,10 +54,6 @@ public class DocumentReceiver {

        } catch (Exception ignore) {
        }
-        } catch (Exception e) {
-            e.printStackTrace();
-            return null;
-        }
        return document;
    }
 }
--- a/app/src/main/java/com/akdev/nofbeventscraper/FbEventScraper.java
+++ b/app/src/main/java/com/akdev/nofbeventscraper/FbEventScraper.java
@@ -5,6 +5,7 @@ import android.util.Log;

 import org.json.JSONException;
 import org.json.JSONObject;
+import org.jsoup.HttpStatusException;
 import org.jsoup.nodes.Document;

 import java.io.IOException;
@@ -146,9 +147,8 @@ public class FbEventScraper extends AsyncTask<Void, Void, Void> {

        Log.d("scraperLog", "doInBackground: "+url);

-        Document document = DocumentReceiver.getDocument(url);
-
        try {
+            Document document = DocumentReceiver.getDocument(url);
            if (document == null) {
                throw new IOException();
            }
@@ -191,7 +191,10 @@ public class FbEventScraper extends AsyncTask<Void, Void, Void> {

            this.event = new FbEvent(url, name, start_date, end_date, description, location, image_url);

-        } catch (IOException e) {
+        } catch (HttpStatusException e) {
+            this.error = R.string.error_url;
+        }
+        catch (IOException e) {
            e.printStackTrace();
            this.error = R.string.error_connection;
        } catch (Exception e) {
--- a/app/src/main/java/com/akdev/nofbeventscraper/FbPageScraper.java
+++ b/app/src/main/java/com/akdev/nofbeventscraper/FbPageScraper.java
@@ -5,6 +5,7 @@ import android.os.AsyncTask;

 import androidx.preference.PreferenceManager;

+import org.jsoup.HttpStatusException;
 import org.jsoup.nodes.Document;

 import java.io.IOException;
@@ -95,7 +96,9 @@ public class FbPageScraper extends AsyncTask<Void, Void, Void> {
                    url = null;
                    event_links = event_links.subList(0, max);
                }
-
+            } catch (HttpStatusException e) {
+                this.error = R.string.error_url;
+                return null;
            } catch (IOException e) {
                e.printStackTrace();
                this.error = R.string.error_connection;
--- a/app/src/main/java/com/akdev/nofbeventscraper/FbScraper.java
+++ b/app/src/main/java/com/akdev/nofbeventscraper/FbScraper.java
@@ -264,6 +264,17 @@ public class FbScraper {
            url_type = url_type_enum.PAGE;
            scrapePage(page_url);

+            return;
+
+        } catch (URISyntaxException | MalformedURLException e) {
+            url_type = url_type_enum.INVALID;
+        }
+        // check if only page name without prefix
+        try {
+            String page_url = getPageUrl("https://mbasic.facebook.com/"+input_url);
+            url_type = url_type_enum.PAGE;
+            scrapePage(page_url);
+
        } catch (URISyntaxException | MalformedURLException e) {
            url_type = url_type_enum.INVALID;
            main.get().input_helper(main.get().getString(R.string.error_url), true);