From 6d6f1f4078c745e6ba7560a71c5ff65d1aa7d963 Mon Sep 17 00:00:00 2001
From: Tom Sepez <tsepez@chromium.org>
Date: Tue, 15 Mar 2016 09:10:05 -0700
Subject: Tidy fpdftext/ directory

Make .h/.cpp filenames match.
Add header for unicodenormalization.cpp
Remove dead code.

R=dsinclair@chromium.org

Review URL: https://codereview.chromium.org/1796303002 .
---
 BUILD.gn                                 |   2 +
 core/fpdftext/fpdf_text_int.cpp          |   3 +-
 core/fpdftext/fpdf_text_int.h            | 244 ++++++++++++++++++++++++++++++
 core/fpdftext/fpdf_text_int_unittest.cpp |   4 +-
 core/fpdftext/text_int.h                 | 246 -------------------------------
 core/fpdftext/unicodenormalization.cpp   |  30 +---
 core/fpdftext/unicodenormalization.h     |  14 ++
 pdfium.gyp                               |   3 +-
 8 files changed, 272 insertions(+), 274 deletions(-)
 create mode 100644 core/fpdftext/fpdf_text_int.h
 delete mode 100644 core/fpdftext/text_int.h
 create mode 100644 core/fpdftext/unicodenormalization.h
diff --git a/BUILD.gn b/BUILD.gn
index c9c5b016aa..41322669a5 100644
--- a/BUILD.gn
+++ b/BUILD.gn
@@ -390,11 +390,13 @@ static_library("fpdfapi") {
 static_library("fpdftext") {
   sources = [
     "core/fpdftext/fpdf_text_int.cpp",
+    "core/fpdftext/fpdf_text_int.h",
     "core/fpdftext/include/ipdf_linkextract.h",
     "core/fpdftext/include/ipdf_textpage.h",
     "core/fpdftext/include/ipdf_textpagefind.h",
     "core/fpdftext/text_int.h",
     "core/fpdftext/unicodenormalization.cpp",
+    "core/fpdftext/unicodenormalization.h",
     "core/fpdftext/unicodenormalizationdata.cpp",
     "core/fpdftext/unicodenormalizationdata.h",
   ]
diff --git a/core/fpdftext/fpdf_text_int.cpp b/core/fpdftext/fpdf_text_int.cpp
index 1bd544c444..f862af9fbe 100644
--- a/core/fpdftext/fpdf_text_int.cpp
+++ b/core/fpdftext/fpdf_text_int.cpp
@@ -4,7 +4,7 @@
 
 // Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com
 
-#include "core/fpdftext/text_int.h"
+#include "core/fpdftext/fpdf_text_int.h"
 
 #include <algorithm>
 #include <cctype>
@@ -16,6 +16,7 @@
 #include "core/fpdftext/include/ipdf_linkextract.h"
 #include "core/fpdftext/include/ipdf_textpage.h"
 #include "core/fpdftext/include/ipdf_textpagefind.h"
+#include "core/fpdftext/unicodenormalization.h"
 #include "core/include/fpdfapi/cpdf_dictionary.h"
 #include "core/include/fpdfapi/cpdf_string.h"
 #include "core/include/fpdfapi/fpdf_module.h"
diff --git a/core/fpdftext/fpdf_text_int.h b/core/fpdftext/fpdf_text_int.h
new file mode 100644
index 0000000000..7ebf653f27
--- /dev/null
+++ b/core/fpdftext/fpdf_text_int.h
@@ -0,0 +1,244 @@
+// Copyright 2014 PDFium Authors. All rights reserved.
+// Use of this source code is governed by a BSD-style license that can be
+// found in the LICENSE file.
+
+// Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com
+
+#ifndef CORE_FPDFTEXT_FPDF_TEXT_INT_H_
+#define CORE_FPDFTEXT_FPDF_TEXT_INT_H_
+
+#include <deque>
+#include <vector>
+
+#include "core/fpdftext/include/ipdf_linkextract.h"
+#include "core/fpdftext/include/ipdf_textpage.h"
+#include "core/fpdftext/include/ipdf_textpagefind.h"
+#include "core/include/fpdfapi/fpdf_page.h"
+#include "core/include/fxcrt/fx_basic.h"
+
+class CFX_BidiChar;
+class CPDF_FormObject;
+class CPDF_LinkExtract;
+class CPDF_TextPageFind;
+
+#define FPDFTEXT_CHAR_ERROR -1
+#define FPDFTEXT_CHAR_NORMAL 0
+#define FPDFTEXT_CHAR_GENERATED 1
+#define FPDFTEXT_CHAR_UNUNICODE 2
+#define FPDFTEXT_CHAR_HYPHEN 3
+#define FPDFTEXT_CHAR_PIECE 4
+#define FPDFTEXT_MC_PASS 0
+#define FPDFTEXT_MC_DONE 1
+#define FPDFTEXT_MC_DELAY 2
+
+struct PAGECHAR_INFO {
+  int m_CharCode;
+  FX_WCHAR m_Unicode;
+  FX_FLOAT m_OriginX;
+  FX_FLOAT m_OriginY;
+  int32_t m_Flag;
+  CFX_FloatRect m_CharBox;
+  CPDF_TextObject* m_pTextObj;
+  CFX_Matrix m_Matrix;
+  int m_Index;
+};
+
+struct FPDF_SEGMENT {
+  int m_Start;
+  int m_nCount;
+};
+
+struct PDFTEXT_Obj {
+  CPDF_TextObject* m_pTextObj;
+  CFX_Matrix m_formMatrix;
+};
+
+class CPDF_TextPage : public IPDF_TextPage {
+ public:
+  CPDF_TextPage(const CPDF_Page* pPage, int flags);
+  ~CPDF_TextPage() override {}
+
+  // IPDF_TextPage:
+  void ParseTextPage() override;
+  bool IsParsed() const override { return m_bIsParsed; }
+  int CharIndexFromTextIndex(int TextIndex) const override;
+  int TextIndexFromCharIndex(int CharIndex) const override;
+  int CountChars() const override;
+  void GetCharInfo(int index, FPDF_CHAR_INFO* info) const override;
+  void GetRectArray(int start,
+                    int nCount,
+                    CFX_RectArray& rectArray) const override;
+  int GetIndexAtPos(CFX_FloatPoint point,
+                    FX_FLOAT xTolerance,
+                    FX_FLOAT yTolerance) const override;
+  int GetIndexAtPos(FX_FLOAT x,
+                    FX_FLOAT y,
+                    FX_FLOAT xTolerance,
+                    FX_FLOAT yTolerance) const override;
+  CFX_WideString GetTextByRect(const CFX_FloatRect& rect) const override;
+  void GetRectsArrayByRect(const CFX_FloatRect& rect,
+                           CFX_RectArray& resRectArray) const override;
+  CFX_WideString GetPageText(int start = 0, int nCount = -1) const override;
+  int CountRects(int start, int nCount) override;
+  void GetRect(int rectIndex,
+               FX_FLOAT& left,
+               FX_FLOAT& top,
+               FX_FLOAT& right,
+               FX_FLOAT& bottom) const override;
+  FX_BOOL GetBaselineRotate(int rectIndex, int& Rotate) override;
+  FX_BOOL GetBaselineRotate(const CFX_FloatRect& rect, int& Rotate) override;
+  int CountBoundedSegments(FX_FLOAT left,
+                           FX_FLOAT top,
+                           FX_FLOAT right,
+                           FX_FLOAT bottom,
+                           FX_BOOL bContains = FALSE) override;
+  void GetBoundedSegment(int index, int& start, int& count) const override;
+  int GetWordBreak(int index, int direction) const override;
+
+  static FX_BOOL IsRectIntersect(const CFX_FloatRect& rect1,
+                                 const CFX_FloatRect& rect2);
+  static FX_BOOL IsLetter(FX_WCHAR unicode);
+
+ private:
+  FX_BOOL IsHyphen(FX_WCHAR curChar);
+  bool IsControlChar(const PAGECHAR_INFO& charInfo);
+  FX_BOOL GetBaselineRotate(int start, int end, int& Rotate);
+  void ProcessObject();
+  void ProcessFormObject(CPDF_FormObject* pFormObj,
+                         const CFX_Matrix& formMatrix);
+  void ProcessTextObject(PDFTEXT_Obj pObj);
+  void ProcessTextObject(CPDF_TextObject* pTextObj,
+                         const CFX_Matrix& formMatrix,
+                         const CPDF_PageObjectList* pObjList,
+                         CPDF_PageObjectList::const_iterator ObjPos);
+  int ProcessInsertObject(const CPDF_TextObject* pObj,
+                          const CFX_Matrix& formMatrix);
+  FX_BOOL GenerateCharInfo(FX_WCHAR unicode, PAGECHAR_INFO& info);
+  FX_BOOL IsSameAsPreTextObject(CPDF_TextObject* pTextObj,
+                                const CPDF_PageObjectList* pObjList,
+                                CPDF_PageObjectList::const_iterator ObjPos);
+  FX_BOOL IsSameTextObject(CPDF_TextObject* pTextObj1,
+                           CPDF_TextObject* pTextObj2);
+  int GetCharWidth(FX_DWORD charCode, CPDF_Font* pFont) const;
+  void CloseTempLine();
+  void OnPiece(CFX_BidiChar* pBidi, CFX_WideString& str);
+  int32_t PreMarkedContent(PDFTEXT_Obj pObj);
+  void ProcessMarkedContent(PDFTEXT_Obj pObj);
+  void CheckMarkedContentObject(int32_t& start, int32_t& nCount) const;
+  void FindPreviousTextObject(void);
+  void AddCharInfoByLRDirection(FX_WCHAR wChar, PAGECHAR_INFO info);
+  void AddCharInfoByRLDirection(FX_WCHAR wChar, PAGECHAR_INFO info);
+  int32_t GetTextObjectWritingMode(const CPDF_TextObject* pTextObj);
+  int32_t FindTextlineFlowDirection();
+
+  void SwapTempTextBuf(int32_t iCharListStartAppend, int32_t iBufStartAppend);
+  FX_BOOL IsRightToLeft(const CPDF_TextObject* pTextObj,
+                        const CPDF_Font* pFont,
+                        int nItems) const;
+
+  const CPDF_Page* const m_pPage;
+  std::vector<FX_WORD> m_CharIndex;
+  std::deque<PAGECHAR_INFO> m_CharList;
+  std::deque<PAGECHAR_INFO> m_TempCharList;
+  CFX_WideTextBuf m_TextBuf;
+  CFX_WideTextBuf m_TempTextBuf;
+  const int m_parserflag;
+  CPDF_TextObject* m_pPreTextObj;
+  CFX_Matrix m_perMatrix;
+  bool m_bIsParsed;
+  CFX_Matrix m_DisplayMatrix;
+  CFX_ArrayTemplate<FPDF_SEGMENT> m_Segments;
+  CFX_RectArray m_SelRects;
+  CFX_ArrayTemplate<PDFTEXT_Obj> m_LineObj;
+  int32_t m_TextlineDir;
+  CFX_FloatRect m_CurlineRect;
+};
+
+class CPDF_TextPageFind : public IPDF_TextPageFind {
+ public:
+  explicit CPDF_TextPageFind(const IPDF_TextPage* pTextPage);
+  ~CPDF_TextPageFind() override {}
+
+  // IPDF_TextPageFind
+  FX_BOOL FindFirst(const CFX_WideString& findwhat,
+                    int flags,
+                    int startPos = 0) override;
+  FX_BOOL FindNext() override;
+  FX_BOOL FindPrev() override;
+  void GetRectArray(CFX_RectArray& rects) const override;
+  int GetCurOrder() const override;
+  int GetMatchedCount() const override;
+
+ protected:
+  void ExtractFindWhat(const CFX_WideString& findwhat);
+  FX_BOOL IsMatchWholeWord(const CFX_WideString& csPageText,
+                           int startPos,
+                           int endPos);
+  FX_BOOL ExtractSubString(CFX_WideString& rString,
+                           const FX_WCHAR* lpszFullString,
+                           int iSubString,
+                           FX_WCHAR chSep);
+  CFX_WideString MakeReverse(const CFX_WideString& str);
+  int ReverseFind(const CFX_WideString& csPageText,
+                  const CFX_WideString& csWord,
+                  int nStartPos,
+                  int& WordLength);
+  int GetCharIndex(int index) const;
+
+ private:
+  std::vector<FX_WORD> m_CharIndex;
+  const IPDF_TextPage* m_pTextPage;
+  CFX_WideString m_strText;
+  CFX_WideString m_findWhat;
+  int m_flags;
+  std::vector<CFX_WideString> m_csFindWhatArray;
+  int m_findNextStart;
+  int m_findPreStart;
+  FX_BOOL m_bMatchCase;
+  FX_BOOL m_bMatchWholeWord;
+  int m_resStart;
+  int m_resEnd;
+  CFX_RectArray m_resArray;
+  FX_BOOL m_IsFind;
+};
+
+class CPDF_LinkExt {
+ public:
+  CPDF_LinkExt() {}
+  int m_Start;
+  int m_Count;
+  CFX_WideString m_strUrl;
+  virtual ~CPDF_LinkExt() {}
+};
+
+typedef CFX_ArrayTemplate<CPDF_LinkExt*> LINK_InfoArray;
+
+class CPDF_LinkExtract : public IPDF_LinkExtract {
+ public:
+  CPDF_LinkExtract();
+  ~CPDF_LinkExtract() override;
+
+  // IPDF_LinkExtract
+  FX_BOOL ExtractLinks(const IPDF_TextPage* pTextPage) override;
+  int CountLinks() const override;
+  CFX_WideString GetURL(int index) const override;
+  void GetBoundedSegment(int index, int& start, int& count) const override;
+  void GetRects(int index, CFX_RectArray& rects) const override;
+
+  FX_BOOL IsExtract() const { return m_bIsParsed; }
+
+ protected:
+  void ParseLink();
+  void DeleteLinkList();
+  FX_BOOL CheckWebLink(CFX_WideString& strBeCheck);
+  bool CheckMailLink(CFX_WideString& str);
+  void AppendToLinkList(int start, int count, const CFX_WideString& strUrl);
+
+ private:
+  LINK_InfoArray m_LinkList;
+  const CPDF_TextPage* m_pTextPage;
+  CFX_WideString m_strPageText;
+  bool m_bIsParsed;
+};
+
+#endif  // CORE_FPDFTEXT_FPDF_TEXT_INT_H_
diff --git a/core/fpdftext/fpdf_text_int_unittest.cpp b/core/fpdftext/fpdf_text_int_unittest.cpp
index d114ba75ce..c1c29cde97 100644
--- a/core/fpdftext/fpdf_text_int_unittest.cpp
+++ b/core/fpdftext/fpdf_text_int_unittest.cpp
@@ -2,9 +2,9 @@
 // Use of this source code is governed by a BSD-style license that can be
 // found in the LICENSE file.
 
-#include "testing/gtest/include/gtest/gtest.h"
+#include "core/fpdftext/fpdf_text_int.h"
 
-#include "core/fpdftext/text_int.h"
+#include "testing/gtest/include/gtest/gtest.h"
 
 // Class to help test functions in CPDF_LinkExtract class.
 class CPDF_TestLinkExtract : public CPDF_LinkExtract {
diff --git a/core/fpdftext/text_int.h b/core/fpdftext/text_int.h
deleted file mode 100644
index 42e254ee63..0000000000
--- a/core/fpdftext/text_int.h
+++ /dev/null
@@ -1,246 +0,0 @@
-// Copyright 2014 PDFium Authors. All rights reserved.
-// Use of this source code is governed by a BSD-style license that can be
-// found in the LICENSE file.
-
-// Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com
-
-#ifndef CORE_FPDFTEXT_TEXT_INT_H_
-#define CORE_FPDFTEXT_TEXT_INT_H_
-
-#include <deque>
-#include <vector>
-
-#include "core/fpdftext/include/ipdf_linkextract.h"
-#include "core/fpdftext/include/ipdf_textpage.h"
-#include "core/fpdftext/include/ipdf_textpagefind.h"
-#include "core/include/fpdfapi/fpdf_page.h"
-#include "core/include/fxcrt/fx_basic.h"
-
-class CFX_BidiChar;
-class CPDF_FormObject;
-class CPDF_LinkExtract;
-class CPDF_TextPageFind;
-
-#define FPDFTEXT_CHAR_ERROR -1
-#define FPDFTEXT_CHAR_NORMAL 0
-#define FPDFTEXT_CHAR_GENERATED 1
-#define FPDFTEXT_CHAR_UNUNICODE 2
-#define FPDFTEXT_CHAR_HYPHEN 3
-#define FPDFTEXT_CHAR_PIECE 4
-#define FPDFTEXT_MC_PASS 0
-#define FPDFTEXT_MC_DONE 1
-#define FPDFTEXT_MC_DELAY 2
-
-struct PAGECHAR_INFO {
-  int m_CharCode;
-  FX_WCHAR m_Unicode;
-  FX_FLOAT m_OriginX;
-  FX_FLOAT m_OriginY;
-  int32_t m_Flag;
-  CFX_FloatRect m_CharBox;
-  CPDF_TextObject* m_pTextObj;
-  CFX_Matrix m_Matrix;
-  int m_Index;
-};
-
-struct FPDF_SEGMENT {
-  int m_Start;
-  int m_nCount;
-};
-
-struct PDFTEXT_Obj {
-  CPDF_TextObject* m_pTextObj;
-  CFX_Matrix m_formMatrix;
-};
-
-class CPDF_TextPage : public IPDF_TextPage {
- public:
-  CPDF_TextPage(const CPDF_Page* pPage, int flags);
-  ~CPDF_TextPage() override {}
-
-  // IPDF_TextPage:
-  void ParseTextPage() override;
-  bool IsParsed() const override { return m_bIsParsed; }
-  int CharIndexFromTextIndex(int TextIndex) const override;
-  int TextIndexFromCharIndex(int CharIndex) const override;
-  int CountChars() const override;
-  void GetCharInfo(int index, FPDF_CHAR_INFO* info) const override;
-  void GetRectArray(int start,
-                    int nCount,
-                    CFX_RectArray& rectArray) const override;
-  int GetIndexAtPos(CFX_FloatPoint point,
-                    FX_FLOAT xTolerance,
-                    FX_FLOAT yTolerance) const override;
-  int GetIndexAtPos(FX_FLOAT x,
-                    FX_FLOAT y,
-                    FX_FLOAT xTolerance,
-                    FX_FLOAT yTolerance) const override;
-  CFX_WideString GetTextByRect(const CFX_FloatRect& rect) const override;
-  void GetRectsArrayByRect(const CFX_FloatRect& rect,
-                           CFX_RectArray& resRectArray) const override;
-  CFX_WideString GetPageText(int start = 0, int nCount = -1) const override;
-  int CountRects(int start, int nCount) override;
-  void GetRect(int rectIndex,
-               FX_FLOAT& left,
-               FX_FLOAT& top,
-               FX_FLOAT& right,
-               FX_FLOAT& bottom) const override;
-  FX_BOOL GetBaselineRotate(int rectIndex, int& Rotate) override;
-  FX_BOOL GetBaselineRotate(const CFX_FloatRect& rect, int& Rotate) override;
-  int CountBoundedSegments(FX_FLOAT left,
-                           FX_FLOAT top,
-                           FX_FLOAT right,
-                           FX_FLOAT bottom,
-                           FX_BOOL bContains = FALSE) override;
-  void GetBoundedSegment(int index, int& start, int& count) const override;
-  int GetWordBreak(int index, int direction) const override;
-
-  static FX_BOOL IsRectIntersect(const CFX_FloatRect& rect1,
-                                 const CFX_FloatRect& rect2);
-  static FX_BOOL IsLetter(FX_WCHAR unicode);
-
- private:
-  FX_BOOL IsHyphen(FX_WCHAR curChar);
-  bool IsControlChar(const PAGECHAR_INFO& charInfo);
-  FX_BOOL GetBaselineRotate(int start, int end, int& Rotate);
-  void ProcessObject();
-  void ProcessFormObject(CPDF_FormObject* pFormObj,
-                         const CFX_Matrix& formMatrix);
-  void ProcessTextObject(PDFTEXT_Obj pObj);
-  void ProcessTextObject(CPDF_TextObject* pTextObj,
-                         const CFX_Matrix& formMatrix,
-                         const CPDF_PageObjectList* pObjList,
-                         CPDF_PageObjectList::const_iterator ObjPos);
-  int ProcessInsertObject(const CPDF_TextObject* pObj,
-                          const CFX_Matrix& formMatrix);
-  FX_BOOL GenerateCharInfo(FX_WCHAR unicode, PAGECHAR_INFO& info);
-  FX_BOOL IsSameAsPreTextObject(CPDF_TextObject* pTextObj,
-                                const CPDF_PageObjectList* pObjList,
-                                CPDF_PageObjectList::const_iterator ObjPos);
-  FX_BOOL IsSameTextObject(CPDF_TextObject* pTextObj1,
-                           CPDF_TextObject* pTextObj2);
-  int GetCharWidth(FX_DWORD charCode, CPDF_Font* pFont) const;
-  void CloseTempLine();
-  void OnPiece(CFX_BidiChar* pBidi, CFX_WideString& str);
-  int32_t PreMarkedContent(PDFTEXT_Obj pObj);
-  void ProcessMarkedContent(PDFTEXT_Obj pObj);
-  void CheckMarkedContentObject(int32_t& start, int32_t& nCount) const;
-  void FindPreviousTextObject(void);
-  void AddCharInfoByLRDirection(FX_WCHAR wChar, PAGECHAR_INFO info);
-  void AddCharInfoByRLDirection(FX_WCHAR wChar, PAGECHAR_INFO info);
-  int32_t GetTextObjectWritingMode(const CPDF_TextObject* pTextObj);
-  int32_t FindTextlineFlowDirection();
-
-  void SwapTempTextBuf(int32_t iCharListStartAppend, int32_t iBufStartAppend);
-  FX_BOOL IsRightToLeft(const CPDF_TextObject* pTextObj,
-                        const CPDF_Font* pFont,
-                        int nItems) const;
-
-  const CPDF_Page* const m_pPage;
-  std::vector<FX_WORD> m_CharIndex;
-  std::deque<PAGECHAR_INFO> m_CharList;
-  std::deque<PAGECHAR_INFO> m_TempCharList;
-  CFX_WideTextBuf m_TextBuf;
-  CFX_WideTextBuf m_TempTextBuf;
-  const int m_parserflag;
-  CPDF_TextObject* m_pPreTextObj;
-  CFX_Matrix m_perMatrix;
-  bool m_bIsParsed;
-  CFX_Matrix m_DisplayMatrix;
-  CFX_ArrayTemplate<FPDF_SEGMENT> m_Segments;
-  CFX_RectArray m_SelRects;
-  CFX_ArrayTemplate<PDFTEXT_Obj> m_LineObj;
-  int32_t m_TextlineDir;
-  CFX_FloatRect m_CurlineRect;
-};
-
-class CPDF_TextPageFind : public IPDF_TextPageFind {
- public:
-  explicit CPDF_TextPageFind(const IPDF_TextPage* pTextPage);
-  ~CPDF_TextPageFind() override {}
-
-  // IPDF_TextPageFind
-  FX_BOOL FindFirst(const CFX_WideString& findwhat,
-                    int flags,
-                    int startPos = 0) override;
-  FX_BOOL FindNext() override;
-  FX_BOOL FindPrev() override;
-  void GetRectArray(CFX_RectArray& rects) const override;
-  int GetCurOrder() const override;
-  int GetMatchedCount() const override;
-
- protected:
-  void ExtractFindWhat(const CFX_WideString& findwhat);
-  FX_BOOL IsMatchWholeWord(const CFX_WideString& csPageText,
-                           int startPos,
-                           int endPos);
-  FX_BOOL ExtractSubString(CFX_WideString& rString,
-                           const FX_WCHAR* lpszFullString,
-                           int iSubString,
-                           FX_WCHAR chSep);
-  CFX_WideString MakeReverse(const CFX_WideString& str);
-  int ReverseFind(const CFX_WideString& csPageText,
-                  const CFX_WideString& csWord,
-                  int nStartPos,
-                  int& WordLength);
-  int GetCharIndex(int index) const;
-
- private:
-  std::vector<FX_WORD> m_CharIndex;
-  const IPDF_TextPage* m_pTextPage;
-  CFX_WideString m_strText;
-  CFX_WideString m_findWhat;
-  int m_flags;
-  std::vector<CFX_WideString> m_csFindWhatArray;
-  int m_findNextStart;
-  int m_findPreStart;
-  FX_BOOL m_bMatchCase;
-  FX_BOOL m_bMatchWholeWord;
-  int m_resStart;
-  int m_resEnd;
-  CFX_RectArray m_resArray;
-  FX_BOOL m_IsFind;
-};
-
-class CPDF_LinkExt {
- public:
-  CPDF_LinkExt() {}
-  int m_Start;
-  int m_Count;
-  CFX_WideString m_strUrl;
-  virtual ~CPDF_LinkExt() {}
-};
-
-typedef CFX_ArrayTemplate<CPDF_LinkExt*> LINK_InfoArray;
-
-class CPDF_LinkExtract : public IPDF_LinkExtract {
- public:
-  CPDF_LinkExtract();
-  ~CPDF_LinkExtract() override;
-
-  // IPDF_LinkExtract
-  FX_BOOL ExtractLinks(const IPDF_TextPage* pTextPage) override;
-  int CountLinks() const override;
-  CFX_WideString GetURL(int index) const override;
-  void GetBoundedSegment(int index, int& start, int& count) const override;
-  void GetRects(int index, CFX_RectArray& rects) const override;
-
-  FX_BOOL IsExtract() const { return m_bIsParsed; }
-
- protected:
-  void ParseLink();
-  void DeleteLinkList();
-  FX_BOOL CheckWebLink(CFX_WideString& strBeCheck);
-  bool CheckMailLink(CFX_WideString& str);
-  void AppendToLinkList(int start, int count, const CFX_WideString& strUrl);
-
- private:
-  LINK_InfoArray m_LinkList;
-  const CPDF_TextPage* m_pTextPage;
-  CFX_WideString m_strPageText;
-  bool m_bIsParsed;
-};
-
-FX_STRSIZE FX_Unicode_GetNormalization(FX_WCHAR wch, FX_WCHAR* pDst);
-
-#endif  // CORE_FPDFTEXT_TEXT_INT_H_
diff --git a/core/fpdftext/unicodenormalization.cpp b/core/fpdftext/unicodenormalization.cpp
index 6ede1365c4..b8e8eb98d3 100644
--- a/core/fpdftext/unicodenormalization.cpp
+++ b/core/fpdftext/unicodenormalization.cpp
@@ -4,13 +4,19 @@
 
 // Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com
 
+#include "core/fpdftext/unicodenormalization.h"
+
 #include "core/fpdftext/unicodenormalizationdata.h"
 #include "core/include/fxcrt/fx_string.h"
 
+namespace {
+
 const FX_WCHAR* const g_UnicodeData_Normalization_Maps[5] = {
     nullptr, g_UnicodeData_Normalization_Map1, g_UnicodeData_Normalization_Map2,
     g_UnicodeData_Normalization_Map3, g_UnicodeData_Normalization_Map4};
 
+}  // namespace
+
 FX_STRSIZE FX_Unicode_GetNormalization(FX_WCHAR wch, FX_WCHAR* pDst) {
   wch = wch & 0xFFFF;
   FX_WCHAR wFind = g_UnicodeData_Normalization[wch];
@@ -42,27 +48,3 @@ FX_STRSIZE FX_Unicode_GetNormalization(FX_WCHAR wch, FX_WCHAR* pDst) {
   }
   return (FX_STRSIZE)wFind;
 }
-FX_STRSIZE FX_WideString_GetNormalization(const CFX_WideStringC& wsSrc,
-                                          FX_WCHAR* pDst) {
-  FX_STRSIZE nCount = 0;
-  for (FX_STRSIZE len = 0; len < wsSrc.GetLength(); len++) {
-    FX_WCHAR wch = wsSrc.GetAt(len);
-    if (pDst) {
-      nCount += FX_Unicode_GetNormalization(wch, pDst + nCount);
-    } else {
-      nCount += FX_Unicode_GetNormalization(wch, pDst);
-    }
-  }
-  return nCount;
-}
-FX_STRSIZE FX_WideString_GetNormalization(const CFX_WideStringC& wsSrc,
-                                          CFX_WideString& wsDst) {
-  FX_STRSIZE nLen = FX_WideString_GetNormalization(wsSrc, (FX_WCHAR*)NULL);
-  if (!nLen) {
-    return 0;
-  }
-  FX_WCHAR* pBuf = wsDst.GetBuffer(nLen);
-  FX_WideString_GetNormalization(wsSrc, pBuf);
-  wsDst.ReleaseBuffer(nLen);
-  return nLen;
-}
diff --git a/core/fpdftext/unicodenormalization.h b/core/fpdftext/unicodenormalization.h
new file mode 100644
index 0000000000..d9beafbd41
--- /dev/null
+++ b/core/fpdftext/unicodenormalization.h
@@ -0,0 +1,14 @@
+// Copyright 2014 PDFium Authors. All rights reserved.
+// Use of this source code is governed by a BSD-style license that can be
+// found in the LICENSE file.
+
+// Original code copyright 2014 Foxit Software Inc. http://www.foxitsoftware.com
+
+#ifndef CORE_FPDFTEXT_UNICODENORMALIZATION_H_
+#define CORE_FPDFTEXT_UNICODENORMALIZATION_H_
+
+#include "core/include/fxcrt/fx_system.h"
+
+FX_STRSIZE FX_Unicode_GetNormalization(FX_WCHAR wch, FX_WCHAR* pDst);
+
+#endif  // CORE_FPDFTEXT_UNICODENORMALIZATION_H_
diff --git a/pdfium.gyp b/pdfium.gyp
index 9d986b29eb..acd17f36ac 100644
--- a/pdfium.gyp
+++ b/pdfium.gyp
@@ -407,8 +407,9 @@
         'core/fpdftext/include/ipdf_textpage.h',
         'core/fpdftext/include/ipdf_textpagefind.h',
         'core/fpdftext/fpdf_text_int.cpp',
-        'core/fpdftext/text_int.h',
+        'core/fpdftext/fpdf_text_int.h',
         'core/fpdftext/unicodenormalization.cpp',
+        'core/fpdftext/unicodenormalization.h',
         'core/fpdftext/unicodenormalizationdata.cpp',
         'core/fpdftext/unicodenormalizationdata.h',
       ],
-- 
cgit v1.2.3