relayd: rename fd-cap parameter to fd-pool-size
authorJérémie Galarneau <jeremie.galarneau@efficios.com>
Wed, 27 Nov 2019 06:11:02 +0000 (01:11 -0500)
committerJérémie Galarneau <jeremie.galarneau@efficios.com>
Thu, 30 Jan 2020 06:55:34 +0000 (01:55 -0500)
Rename the fd-cap parameter and change its default behaviour.
The minimum number of file descriptor is raised to 100 and a
"reserve" amount of 10 fds is allowed to accomodate transient
fd uses that can't be tracked by the relay daemon.

The --fd-pool-size will accept parameters in the
[100, fileno soft limit] interval.

Signed-off-by: Jérémie Galarneau <jeremie.galarneau@efficios.com>
Change-Id: I9c7bf344344901b4d6f0d95620210ebda5fd0196

src/bin/lttng-relayd/main.c
src/common/defaults.h

index 69f41a31c2a95e58cd345c1e9778f1064adfd62c..62e1cf9309e4355c7b6e892fc999a20c665557a9 100644 (file)
@@ -165,7 +165,7 @@ static uint64_t last_relay_stream_id;
 static struct relay_conn_queue relay_conn_queue;
 
 /* Cap of file desriptors to be in simultaneous use by the relay daemon. */
-static unsigned int lttng_opt_fd_cap;
+static unsigned int lttng_opt_fd_pool_size = -1;
 
 /* Global relay stream hash table. */
 struct lttng_ht *relay_streams_ht;
@@ -191,7 +191,7 @@ static struct option long_options[] = {
        { "daemonize", 0, 0, 'd', },
        { "background", 0, 0, 'b', },
        { "group", 1, 0, 'g', },
-       { "fd-cap", 1, 0, '\0', },
+       { "fd-pool-size", 1, 0, '\0', },
        { "help", 0, 0, 'h', },
        { "output", 1, 0, 'o', },
        { "verbose", 0, 0, 'v', },
@@ -235,29 +235,22 @@ static int set_option(int opt, const char *arg, const char *optname)
 
        switch (opt) {
        case 0:
-               if (!strcmp(optname, "fd-cap")) {
+               if (!strcmp(optname, "fd-pool-size")) {
                        unsigned long v;
 
                        errno = 0;
                        v = strtoul(arg, NULL, 0);
                        if (errno != 0 || !isdigit(arg[0])) {
-                               ERR("Wrong value in --fd-cap parameter: %s",
-                                               arg);
+                               ERR("Wrong value in --fd-pool-size parameter: %s", arg);
                                ret = -1;
                                goto end;
                        }
-                       if (v < DEFAULT_RELAYD_MINIMAL_FD_CAP) {
-                               ERR("File descriptor cap must be set to at least %d",
-                                               DEFAULT_RELAYD_MINIMAL_FD_CAP);
-                       }
                        if (v >= UINT_MAX) {
-                               ERR("File descriptor cap overflow in --fd-cap parameter: %s",
-                                               arg);
+                               ERR("File descriptor cap overflow in --fd-pool-size parameter: %s", arg);
                                ret = -1;
                                goto end;
                        }
-                       lttng_opt_fd_cap = (unsigned int) v;
-                       DBG3("File descriptor cap set to %u", lttng_opt_fd_cap);
+                       lttng_opt_fd_pool_size = (unsigned int) v;
                } else {
                        fprintf(stderr, "unknown option %s", optname);
                        if (arg) {
@@ -482,6 +475,56 @@ static int parse_env_options(void)
        return ret;
 }
 
+static int set_fd_pool_size(void)
+{
+       int ret = 0;
+       struct rlimit rlimit;
+
+       ret = getrlimit(RLIMIT_NOFILE, &rlimit);
+       if (ret) {
+               PERROR("Failed to get file descriptor limit");
+               ret = -1;
+               goto end;
+       }
+
+       DBG("File descriptor count limits are %" PRIu64 " (soft) and %" PRIu64 " (hard)",
+                       (uint64_t) rlimit.rlim_cur,
+                       (uint64_t) rlimit.rlim_max);
+       if (lttng_opt_fd_pool_size == -1) {
+               /* Use default value (soft limit - reserve). */
+               if (rlimit.rlim_cur < DEFAULT_RELAYD_MIN_FD_POOL_SIZE) {
+                       ERR("The process' file number limit is too low (%" PRIu64 "). The process' file number limit must be set to at least %i.",
+                                       (uint64_t) rlimit.rlim_cur, DEFAULT_RELAYD_MIN_FD_POOL_SIZE);
+                       ret = -1;
+                       goto end;
+               }
+               lttng_opt_fd_pool_size = rlimit.rlim_cur -
+                               DEFAULT_RELAYD_FD_POOL_SIZE_RESERVE;
+               goto end;
+       }
+
+       if (lttng_opt_fd_pool_size < DEFAULT_RELAYD_MIN_FD_POOL_SIZE) {
+               ERR("File descriptor pool size must be set to at least %d",
+                               DEFAULT_RELAYD_MIN_FD_POOL_SIZE);
+               ret = -1;
+               goto end;
+       }
+
+       if (lttng_opt_fd_pool_size > rlimit.rlim_cur) {
+               ERR("File descriptor pool size argument (%u) exceeds the process' soft limit (%" PRIu64 ").",
+                               lttng_opt_fd_pool_size, (uint64_t) rlimit.rlim_cur);
+               ret = -1;
+               goto end;
+       }
+
+       DBG("File descriptor pool size argument (%u) adjusted to %u to accomodate transient fd uses",
+                       lttng_opt_fd_pool_size,
+                       lttng_opt_fd_pool_size - DEFAULT_RELAYD_FD_POOL_SIZE_RESERVE);
+       lttng_opt_fd_pool_size -= DEFAULT_RELAYD_FD_POOL_SIZE_RESERVE;
+end:
+       return ret;
+}
+
 static int set_options(int argc, char **argv)
 {
        int c, ret = 0, option_index = 0, retval = 0;
@@ -599,17 +642,10 @@ static int set_options(int argc, char **argv)
                        goto exit;
                }
        }
-       if (lttng_opt_fd_cap == 0) {
-               int ret;
-               struct rlimit rlimit;
-
-               ret = getrlimit(RLIMIT_NOFILE, &rlimit);
-               if (ret) {
-                       PERROR("Failed to get file descriptor limit");
-                       retval = -1;
-               }
-
-               lttng_opt_fd_cap = rlimit.rlim_cur;
+       ret = set_fd_pool_size();
+       if (ret) {
+               retval = -1;
+               goto exit;
        }
 
        if (opt_group_output_by == RELAYD_GROUP_OUTPUT_BY_UNKNOWN) {
@@ -641,6 +677,23 @@ static void print_global_objects(void)
        print_sessions();
 }
 
+static int noop_close(void *data, int *fds)
+{
+       return 0;
+}
+
+static void untrack_stdio(void)
+{
+       int fds[] = { fileno(stdout), fileno(stderr) };
+
+       /*
+        * noop_close is used since we don't really want to close
+        * the stdio output fds; we merely want to stop tracking them.
+        */
+       (void) fd_tracker_close_unsuspendable_fd(the_fd_tracker,
+                       fds, 2, noop_close, NULL);
+}
+
 /*
  * Cleanup the daemon
  */
@@ -4047,11 +4100,6 @@ static int stdio_open(void *data, int *fds)
        return 0;
 }
 
-static int noop_close(void *data, int *fds)
-{
-       return 0;
-}
-
 static int track_stdio(void)
 {
        int fds[2];
@@ -4061,18 +4109,6 @@ static int track_stdio(void)
                        names, 2, stdio_open, NULL);
 }
 
-static void untrack_stdio(void)
-{
-       int fds[] = { fileno(stdout), fileno(stderr) };
-
-       /*
-        * noop_close is used since we don't really want to close
-        * the stdio output fds; we merely want to stop tracking them.
-        */
-       (void) fd_tracker_close_unsuspendable_fd(the_fd_tracker,
-                       fds, 2, noop_close, NULL);
-}
-
 /*
  * main
  */
@@ -4171,7 +4207,7 @@ int main(int argc, char **argv)
        rcu_register_thread();
        thread_is_rcu_registered = true;
 
-       the_fd_tracker = fd_tracker_create(lttng_opt_fd_cap);
+       the_fd_tracker = fd_tracker_create(lttng_opt_fd_pool_size);
        if (!the_fd_tracker) {
                retval = -1;
                goto exit_options;
index e57e6495fa7509056e308238caed41d6dfd60b54..56a7c94490014ae5cda156659dcb8c24a8609c2e 100644 (file)
 #define DEFAULT_RELAYD_RUNDIR                  "%s"
 #define DEFAULT_RELAYD_PATH                    DEFAULT_RELAYD_RUNDIR "/relayd"
 
-#define DEFAULT_RELAYD_MINIMAL_FD_CAP          30
+#define DEFAULT_RELAYD_MIN_FD_POOL_SIZE                100
+/*
+ * The file descriptor pool size needs a reserve buffer to accomodate the
+ * indirect use of short-lived file descriptors. For instance, glibc will
+ * create a socket (and thus, use an fd) during calls to gethostname() or
+ * when querying the user's group. Other calls also probably make use of
+ * short-lived FDs.
+ *
+ * The theoritical maximal reserve corresponds to the number of threads as,
+ * in the worst case, they could all be making such calls.
+ *
+ * This value must be less than DEFAULT_RELAYD_MIN_FD_POOL_SIZE.
+ */
+#define DEFAULT_RELAYD_FD_POOL_SIZE_RESERVE    10
 
 /* Default lttng run directory */
 #define DEFAULT_LTTNG_HOME_ENV_VAR              "LTTNG_HOME"
This page took 0.029478 seconds and 4 git commands to generate.